[Talk-de] Neuer Namefinder
Sascha Silbe
sascha-ml-gis-osm-talk-de at silbe.org
Mi Aug 20 11:34:24 UTC 2008
On Wed, Aug 20, 2008 at 12:09:12PM +0200, Marcus Wolschon wrote:
> Super Sache!
Danke! Ich hatte irgendwie mehr mit "helf lieber, den bestehenden
Namefinder zu verbessern statt das Rad neu zu erfinden" gerechnet als
mit so positiven Antworten.
> Welche Suchen kann dein Code?
> (POI-Name? Straße+Ort? Autobahn-Kreuz? A nahe B?)
Der Suchkern kann folgende Suchen:
- Name (exakt, Substring, Regex; name, ref, is_in)
- Ort (BBox)
- Typ
Diese können beliebig kombiniert (hintereinander ausgeführt) werden,
wobei die Quelle für jeden Suchparameter festgelegt werden kann.
Das Frontend kann dann durch passende Kombination die von Dir
aufgeführten Suchen durchführen.
Was derzeit nicht unterstützt wird:
- Hausnummern, PLZ (die nötigen Infos werden derzeit nicht in der
internen DB abgelegt)
- Relationen (insb. Collected Ways)
- "Echte" Polygone (nur BBox => false positives möglich)
> Auch die Suche nach Adressen schon?
> (Str=Alexanderplatz, Ort=Berlin, Land=Germany)
Könnte derzeit vom Frontend folgendermaßen durchgeführt werden:
1. Type: country
2. Name: Name="Germany", nur Nodes+Ways von Schritt 1
3. Type (city|town|village)
4. Name: Name="Berlin", nur Nodes+Ways von Schritt 3
5. Loc: BBox von Schritt 2, Nodes+Ways von Schritt 4
6. Name: Name="Alexanderplatz"
7. Loc: BBox von Schritt 5, Ways von Schritt 6
8. Type: (alle bekannten Straßentypen), Ways von Schritt 7
Also relativ umständlich, aber möglich (der bisherige Namefinder kann
das derzeit nicht).
Für Post-1.0 (also wenn das Frontend die Funktionen des bisherigen
Namefinders alle kann) könnte man sich überlegen, wie man die Daten
entsprechend vorarbeitet und abspeichert, um diese Suche effizienter zu
gestalten. Zum Ablegen vermutlich irgendein Baum - der schwierige Part
ist eher die Performance der Vorverarbeitung: im Europa-Dump sind
Ortsgrenzen (hamlet..city, nicht country o.ä.) drin, die z.B. PostGIS
(verwendet GEOS) nicht in sinnvoller Zeit verarbeiten kann (bereits
ST_IsSimple ist zu langsam!).
> Werden die verschiedenen Sprachen in Ein- und Ausgabe unterstützt?
> (lang:en lang lang:en_uk lang:loc)
Ich muß zugeben, daran habe ich nicht gedacht. Das erfordert noch
kleinere Änderungen.
> Werden die Polygone und is_in-Tags
> von Orten, Postleitzahlen, Bundesländern
> und Ländern ausgewertet?
S.o. is_in ja, Polygone als MBR, PLZ wird nicht gespeichert.
> Welche Platzhalter sind in Suchabfragen erlaubt?
> (*, ?)
Exakt, Substring: Keine
Regex: PCRE (also Perl-kompatibel)
> Welche Normalisierungen machst du für Namen?
Vorgesehen sind die vom alten Namefinder.
> Ich habe Java-Code für die Positions-Bestimmung
> von Hausnummern, wenn einmal die Straße gefunden ist.
> Der sollte sehr einfach nach C (oder in jede andere Sprache) zu
> konvertieren sein.
Hört sich gut an. Wo genau finde ich den? Soll zwar erst Post-1.0 rein,
aber schonmal angucken schadet nicht. :)
CU Sascha
--
http://sascha.silbe.org/
http://www.infra-silbe.de/
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : signature.asc
Dateityp : application/pgp-signature
Dateigröße : 481 bytes
Beschreibung: Digital signature
URL : <http://lists.openstreetmap.org/pipermail/talk-de/attachments/20080820/b526dc1a/attachment.sig>
Mehr Informationen über die Mailingliste Talk-de