[Talk-de] Neuer Namefinder

Sascha Silbe sascha-ml-gis-osm-talk-de at silbe.org
Mi Aug 20 11:34:24 UTC 2008


On Wed, Aug 20, 2008 at 12:09:12PM +0200, Marcus Wolschon wrote:

> Super Sache!
Danke! Ich hatte irgendwie mehr mit "helf lieber, den bestehenden 
Namefinder zu verbessern statt das Rad neu zu erfinden" gerechnet als 
mit so positiven Antworten.

> Welche Suchen kann dein Code?
> (POI-Name? Straße+Ort? Autobahn-Kreuz? A nahe B?)
Der Suchkern kann folgende Suchen:
- Name (exakt, Substring, Regex; name, ref, is_in)
- Ort (BBox)
- Typ

Diese können beliebig kombiniert (hintereinander ausgeführt) werden, 
wobei die Quelle für jeden Suchparameter festgelegt werden kann.

Das Frontend kann dann durch passende Kombination die von Dir 
aufgeführten Suchen durchführen.
Was derzeit nicht unterstützt wird:
- Hausnummern, PLZ (die nötigen Infos werden derzeit nicht in der 
internen DB abgelegt)
- Relationen (insb. Collected Ways)
- "Echte" Polygone (nur BBox => false positives möglich)

> Auch die Suche nach Adressen schon?
> (Str=Alexanderplatz, Ort=Berlin, Land=Germany)
Könnte derzeit vom Frontend folgendermaßen durchgeführt werden:
1. Type: country
2. Name: Name="Germany", nur Nodes+Ways von Schritt 1
3. Type (city|town|village)
4. Name: Name="Berlin", nur Nodes+Ways von Schritt 3
5. Loc: BBox von Schritt 2, Nodes+Ways von Schritt 4
6. Name: Name="Alexanderplatz"
7. Loc: BBox von Schritt 5, Ways von Schritt 6
8. Type: (alle bekannten Straßentypen), Ways von Schritt 7

Also relativ umständlich, aber möglich (der bisherige Namefinder kann 
das derzeit nicht).
Für Post-1.0 (also wenn das Frontend die Funktionen des bisherigen 
Namefinders alle kann) könnte man sich überlegen, wie man die Daten 
entsprechend vorarbeitet und abspeichert, um diese Suche effizienter zu 
gestalten. Zum Ablegen vermutlich irgendein Baum - der schwierige Part 
ist eher die Performance der Vorverarbeitung: im Europa-Dump sind 
Ortsgrenzen (hamlet..city, nicht country o.ä.) drin, die z.B. PostGIS 
(verwendet GEOS) nicht in sinnvoller Zeit verarbeiten kann (bereits 
ST_IsSimple ist zu langsam!).

> Werden die verschiedenen Sprachen in Ein- und Ausgabe unterstützt?
> (lang:en lang lang:en_uk lang:loc)
Ich muß zugeben, daran habe ich nicht gedacht. Das erfordert noch 
kleinere Änderungen.

> Werden die Polygone und is_in-Tags
> von Orten, Postleitzahlen, Bundesländern
> und Ländern ausgewertet?
S.o. is_in ja, Polygone als MBR, PLZ wird nicht gespeichert.

> Welche Platzhalter sind in Suchabfragen erlaubt?
> (*, ?)
Exakt, Substring: Keine
Regex: PCRE (also Perl-kompatibel)

> Welche Normalisierungen machst du für Namen?
Vorgesehen sind die vom alten Namefinder.

> Ich habe Java-Code für die Positions-Bestimmung
> von Hausnummern, wenn einmal die Straße gefunden ist.
> Der sollte sehr einfach nach C (oder in jede andere Sprache) zu
> konvertieren sein.
Hört sich gut an. Wo genau finde ich den? Soll zwar erst Post-1.0 rein, 
aber schonmal angucken schadet nicht. :)

CU Sascha

-- 
http://sascha.silbe.org/
http://www.infra-silbe.de/
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 481 bytes
Beschreibung: Digital signature
URL         : <http://lists.openstreetmap.org/pipermail/talk-de/attachments/20080820/b526dc1a/attachment.sig>


Mehr Informationen über die Mailingliste Talk-de