[Talk-de] Liste mit möglicherweise inkorrekten Straßennamen

Michael Lück Michael.Lueck at Bonk-Consulting.de
Do Dez 30 09:18:21 UTC 2010


Hier nochmal der Link zu der Liste, falls jemand die Mails zuvor nicht bekommen hat:
http://www.bonk-consulting.de/download/osm/errAddresses.htm 

-----Ursprüngliche Nachricht-----
Von: talk-de-bounces at openstreetmap.org [mailto:talk-de-bounces at openstreetmap.org] Im Auftrag von Michael Lück
Gesendet: Donnerstag, 30. Dezember 2010 09:31
An: Openstreetmap allgemeines in Deutsch
Betreff: Re: [Talk-de] Liste mit möglicherweise inkorrekten Straßennamen

Hi,

danke für die Hinweise. Wir haben auch noch die Option unseren FreeAddressCheck gegen die Datenbank selbst laufen zu lassen und mal zu schauen was der dort für ähnliche Adressen findet. Schließlich ist der ja dazu da, Schreibfehler und ähnliches zu finden.
Da lässt sich sicher noch was machen.

Ich hab jetzt die Liste aktualisiert und sie wie gewünscht nach PLZs und Orten sortiert um eine bessere Suche zu ermöglichen.

Grüße,
Micha

-----Ursprüngliche Nachricht-----
Von: talk-de-bounces at openstreetmap.org [mailto:talk-de-bounces at openstreetmap.org] Im Auftrag von Johann H. Addicks
Gesendet: Mittwoch, 29. Dezember 2010 20:21
An: talk-de at openstreetmap.org
Betreff: Re: [Talk-de] Liste mit möglicherweise inkorrekten Straßennamen

Am 29.12.2010 08:36, schrieb Michael Lück:

> Eine fehlerbehaftete Datenquelle zusammen mit den vielen, vielen verschiedenen Ausnahmen von der Regel macht eine Identifizierung fehlerhafter Daten sehr schwierig. Deshalb suchen wir auch nach weiteren Regeln mit denen wir solche finden können ohne zu viele false positives aufzunehmen, was die Korrekturarbeit viel schwieriger macht (vor allem macht das dann keinen Spaß, wenn man immer zu Elementen kommt die ja doch korrekt sind).

Zumindest deutlicher in Richtung "positive" kommst Du, wenn Du z.B. auf 
"Zahl mit Bindestrichen dazwischen" schaust, also "Hauptstraße 4-6" oder 
gar Satzzeichen.
Oder aber wenn Du in den Umkreis schaust: Wenn es dort noch 
Hauptstraßen-Ways gibt, die jedoch ohne oder mit anderen Ziffern da stehen.

DAs kann man auch erweitern: Phonetisch ähnliche Straßen in direkter 
Nachbarschaft sind selten.
Es wird nie ein Meyerweg in einen Maierweg münden.
d.h. wenn Du eine phonetische Reduktion durchführst und dann die 
angrenzenden Wege vergleichst, das wird vermutlich viele Tippfehler finden.

Und dann könntest Du noch schauen, wie viele Du mit falscher 
Rechtschreibung findest.
Bei getrennt geschriebenen Straßen ("Goethe Strasse") schau, ob es zum 
vorderen Bestanddteil vor [Strasse|Platz|Weg|Allee] einen 
Wikipedia-Artikel gibt, (ggf. auch als "xyz (Dichter)"), der in der 
Kategorie "Person" steht.
Dann ist es wahrscheinlich, dass das Leerzeichen "über" ist.
Also z.B. nicht "Mergenthaler Allee", sondern "Mergenthalerallee".

-jha-


_______________________________________________
Talk-de mailing list
Talk-de at openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de

_______________________________________________
Talk-de mailing list
Talk-de at openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de




Mehr Informationen über die Mailingliste Talk-de