[Talk-de] Ansicht der Daten, Straßennamenlänge

Ulf Lamping ulf.lamping at web.de
Mo Jul 23 09:57:27 UTC 2007


qbert biker schrieb:
>> Es geht mir hier nicht um falsch codierte Namen, sondern um Straßennamen 
>> die in Wirklichkeit z.B. mit ss geschrieben werden, weil die im Bauamt 
>> (oder wo auch immer das zu entscheiden ist) zu blöd waren.
>>     
> Und ab diesem Punkt wird es Parallelinterpretationen und 
> Missverständnisse geben. Wer hat in diesem Fall recht? Das
> Bauamt oder der Duden? 
Na wer wohl? Wer vergibt denn bei euch die Straßennamen offiziell? Das 
Bauamt, dieses vergibt die Straßenamen offiziell. Der Duden sagt nur 
etwas darüber aus, wie es sein müßte. Ein Straßenname mag ja laut Duden 
falsch geschrieben sein, ist aber trotzdem dann der offizielle Name ...
> Am besten bezieht man diesen kritischen
> Teil des Strassennamens in die Suche gar nicht ein. 
>
> Mal weg von den theoretischen Fällen in die Praxis. Jemand 
> sucht eine Lindenstrasse in Ort A. In Ort A ist die aber mit
> Lindenstraße eingetragen. 200Km weiter gibt es eine 
> Lindenstrasse in Ort B. Sucht man bis Lindenstra findet man
> die richtige, sonst ist es ein Zufallsspielchen, ob man 
> irgendeine Lindenstr. in einem X-beliebigen Ort findet, nur
> weil da jemand das ß nicht mag (verwendbare Gemeindegrenzen
> haben wir ja noch nicht, so dass höchtens eine Näherung über
> Ortsname und Distanz möglich ist).
>   
Das Problem ist mir vollkommen klar. Aber du vermischt einfach Daten, 
Suche und Rendering.

Die Daten sollen der Realität entsprechen, also so wie die Straße 
offiziell heißt - nicht wie sie laut Duden vielleicht heißen sollte.
Die Suche sollte möglichst das herausfinden, was der Nutzer wirklich 
sucht, also wahrscheinlich unscharf danach suchen, auch bei der 
Sucheingabe kann man sich ja vertippen oder ist sich nicht sicher.
Das Rendering sollte z.B. bei kurzen Straßen versuchen, die Namen 
abzukürzen wenn sie nicht mehr komplett reinpassen, weil eine andere 
Straße im Weg ist. Aber das Algorithmisch in den Griff zu bekommen das 
es wirklich gut funktioniert wird nicht so einfach sein (klar, eine 90% 
Lösung ist bestimmt recht einfach zu machen).
> Und noch was aus der Realwelt: Ich tagge über die Straßenschilder
> draussen vor Ort und die Verkürzen nach Belieben zu Str. und str.
>   
Das mache ich auch so, diese Situation kommt hier in Nürnberg aber nicht 
vor (und ich hab schon einiges hier gemacht). Wenn nur Str. da steht und 
keine weiteren Quellen vorhanden sind wird man darauf hoffen müssen, daß 
die Schreibweise laut Duden wohl die richtige sein wird.
>> Beim suchen bräuchte man dann wohl eher einen unscharfen Algorithmus bei 
>> der Suche ...
>>     
>
> Freilich - nur macht doppelte Unschärfe den Algorithmus nicht
> unbedingt einfacher und sicherer. Deshalb der Ansatz mit dem
> Normal, auf das ich auf Ähnlichkeit prüfe. Etwas Ähnliches zu etwas
> zu finden, das ich selber gar nicht genau kenne, ich würde nicht 
> so vorgehen, aber jedem das seine ;
Du vermischt wieder Daten/Suche/Rendering ...

Die Daten verfälschen, damit die Suche besser damit klarkommt ist einfach der falsche Weg!

Gruß ULFL






Mehr Informationen über die Mailingliste Talk-de