[Talk-de] Status-Update: Adress-Suche bei Garmin-Karten

Bernd Wurst bernd at bwurst.org
So Apr 19 17:32:01 UTC 2009


Hallo.

Am Sonntag 19 April 2009 17:24:12 schrieb Gernot Hillier:
> Ok, einverstanden, dass man es in dieser Richtung löst. Nur leider gibt
> es das nicht in der OSM-Datenbank. Es gibt nur die Möglichkeit, Strings
> zu erfassen, die mit Glück dem Namen des Parent entsprechen. Du kannst
> aber mit an Sicherheit grenzender Wahrscheinlichkeit davon ausgehen,
> dass du mindestens Tippfehler im einstelligen Prozentbereich hast.

Das ist ein Informatikerargument.

Wenn du an jeder Straße Informationen der Art
  name=Foobarstraße
  city=X-Y-Stadt
hast, dann ist die Wahrscheinlichkeit für einen Fehler bei name erstmal gleich 
groß wie bei city. Und wie viele falsch geschriebene Straßennamen haben wir in 
der Datenbank? Meiner Beobachtung nach maximal im Promillebereich. Für die 
Städtenamen tippe ich also auf nicht mehr.

Zudem kann man recht einfach mit Tools ausgeben lassen, welche Ortsnamen in 
einer gewissen bounding-Box gesetzt wurden und erkennt Tippfehler sehr 
schnell. Editoren können einem dabei einfach helfen, siehe KA-
Hausnummernschema.


> Namen aus der realen Welt sind einfach als ID wegen der
> Wahrscheinlichkeit für Tippfehler, Zeichensatzencodings, etc. relativ
> ungeeignet.

Du siehst das zu sehr als Informatiker. Alles braucht eine (numerische) ID, 
diesen Drang kenne ich. ;-)

Aber die Praxis zeigt, dass
1. Namen als ID funktionieren. Siehe KA-Schema und was man schon jetzt damit 
alles machen kann
und
2. allem eine zusätzliche ID zu geben (maschinen- oder menschenlesbar) die 
Komplexität stark erhöht und die Fehler dann auf anderem Level passieren und 
nicht so einfach erkennbar bzw. behebbar sind wie einfache Tippfehler bei 
Namen.

Gruß, Bernd

-- 
Columbus hatte in Wirklichkeit vier Schiffe -
das vierte segelte über die Kante

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 836 bytes
Beschreibung: This is a digitally signed message part.
URL         : <http://lists.openstreetmap.org/pipermail/talk-de/attachments/20090419/2f3e518e/attachment.sig>


Mehr Informationen über die Mailingliste Talk-de