[Talk-de] Ansicht der Daten, Straßennamenlänge

qbert biker qbert1 at gmx.de
Mo Jul 23 09:01:22 UTC 2007


> Es geht mir hier nicht um falsch codierte Namen, sondern um Straßennamen 
> die in Wirklichkeit z.B. mit ss geschrieben werden, weil die im Bauamt 
> (oder wo auch immer das zu entscheiden ist) zu blöd waren.

Und ab diesem Punkt wird es Parallelinterpretationen und 
Missverständnisse geben. Wer hat in diesem Fall recht? Das
Bauamt oder der Duden? Am besten bezieht man diesen kritischen
Teil des Strassennamens in die Suche gar nicht ein. 

Mal weg von den theoretischen Fällen in die Praxis. Jemand 
sucht eine Lindenstrasse in Ort A. In Ort A ist die aber mit
Lindenstraße eingetragen. 200Km weiter gibt es eine 
Lindenstrasse in Ort B. Sucht man bis Lindenstra findet man
die richtige, sonst ist es ein Zufallsspielchen, ob man 
irgendeine Lindenstr. in einem X-beliebigen Ort findet, nur
weil da jemand das ß nicht mag (verwendbare Gemeindegrenzen
haben wir ja noch nicht, so dass höchtens eine Näherung über
Ortsname und Distanz möglich ist).

Und noch was aus der Realwelt: Ich tagge über die Straßenschilder
draussen vor Ort und die Verkürzen nach Belieben zu Str. und str.

> Na wenn du das sagst ...

Probiers doch einfach mal aus. Ich habe mal mit dem Ding gespielt,
das mal auf der Hauptseite beim Bild der Woche verlinkt war.
Die Ergebnisse waren, na ja ;)

> Beim suchen bräuchte man dann wohl eher einen unscharfen Algorithmus bei 
> der Suche ...

Freilich - nur macht doppelte Unschärfe den Algorithmus nicht
unbedingt einfacher und sicherer. Deshalb der Ansatz mit dem
Normal, auf das ich auf Ähnlichkeit prüfe. Etwas Ähnliches zu etwas
zu finden, das ich selber gar nicht genau kenne, ich würde nicht 
so vorgehen, aber jedem das seine ;)

Grüsse Hubert
-- 
GMX FreeMail: 1 GB Postfach, 5 E-Mail-Adressen, 10 Free SMS.
Alle Infos und kostenlose Anmeldung: http://www.gmx.net/de/go/freemail




Mehr Informationen über die Mailingliste Talk-de