[Talk-de] Neuer OpenGeoDB Anlauf gewünscht? (Re: Erster OpenGeoDB Import in OpenStreetMap ist durchgelaufen)

Andreas Stricker andy at knitter.ch
Sa Jan 26 21:04:05 UTC 2008


Sven Anders schrieb:
> * Die falsche Zuordnung von Namen (und dadurch Verdoppelungen).
> Das Problem könnte dadurch gelöst werden, das jeder in seiner Region die Nodes 
> einmalig zusammenfasst und dann das auto_update anpasst).

Könnten einige Fehler nicht dadurch vermieden werden, dass die Namen auf
Ähnlichkeit verglichen werden, z.B. mit der Levenshtein-Distanz [1] oder
dem Soundex [2] Verfahren? Bei Unklarheit muss dann von Hand
eingegriffen werden.

[1] http://de.wikipedia.org/wiki/Levenshtein-Distanz
[2] http://de.wikipedia.org/wiki/Soundex

> * Relationen sind zur Zeit noch gar nicht in OSM eingespielt, das könnte ich 
> aber bald nachholen.

Wie sieht das dann aus?


> * Und es gibt auch Kritik über den fehlerhaften Datenbestand bei OpenGeoDB 
> (wobei wir jetzt den Stand vom Anfang Dezember 2007 eingespielt haben und 
> sich wohl schon einiges geändert hat.)
> 
> 100% ohne Fehler (und ohne Nacharbeit) wird kein Update vonstatten gehen, das 
> ist bei der Größe einfach nicht drinn. Deshalb hier nochmal ganz klar die 
> Frage:
> 
> Sollen wir eine neuen Anlauf wagen?

Klar. Nur wer wagt gewinnt...

> Aktueller Datenbestand (in denen auch kleinere Orte enthalten sind?)? Oder 
> erstmal mit den alten weiter machen und z.B. die Relationen einführen?

Hmm, ich würde erstmals mit dem alten weiterfahren. Nur immer kleine
Schritte auf einmal, auch wegen der Akzeptanz. Den aktuellen
Datenbestand kannst du ja schon einmal vorbereiten und in kleinen
Gebieten testen.

> Sollen OSM Tags eingefügt werden? Man könnte auch erstmal nur openGeoDB:* tags 
> erzeugen und somit testen ohne das dadurch irgendwas gerendert wird.

Das ist eine weitere Option zum Testlauf, anstelle kleinerer Orte, wie
ich oben erwähnt habe.

> Man könnte auch neue Nodes gar nicht automatisch erzeugen sondern nur welche 
> die openGeoDB:loc_id und openGeoDB:auto_update haben anfassen, wenn es eine 
> neue Version gibt.

Mit Sicherheitmechanismen, wie dem Levenshtein-Vergleich (und ev.
weiteren Heuristiken), könnte man das durchaus wagen.

> Ich bin mir auch sehr unsicher, wie wir darüber diskutieren wollen. 
> Auf der Liste?

Ja.

> Ahja: Und ich hoffe es ist mir niemand wirklich böse über den Import!

Ich jedenfalls nicht. Erstens sind urch die OpenGeoDB:*-Tags diese Daten
ja gut erkennbar, und zweitens gibt es genug Möglichkeiten von Hand
einzugreifen und korrigieren, auch wenn jetzt initial schon Arbeit
anfällt.

Mir gefällt die Idee wie die Tags gewählt wurden um später gezielt
einzelne Felder aktualisieren zu können. Auf diese Art haben wir einen
komfortablen Editor für diese Art von Daten und trotzdem die volle
Kontrolle mit den bisherigen Editoren. 

Gruss, Andy

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 189 bytes
Beschreibung: Dies ist ein digital signierter Nachrichtenteil
URL         : <http://lists.openstreetmap.org/pipermail/talk-de/attachments/20080126/07b5c08c/attachment.sig>


Mehr Informationen über die Mailingliste Talk-de