[Talk-de] Doppelte Städtenamen :-(

Martin Trautmann traut at gmx.de
Mi Feb 6 20:18:18 UTC 2008


Stefan Hirschmann wrote:
> Andreas Hubel wrote:
>> Jedenfalls ist durch den Import viel mehr Aufmerksamkeit auf die
>> OpenGeoDB Sache gekommen, als wenn man ewig gewartet hätte bis jemand so
>> auf die Daten eingeht, die als Demo auf Svens Seite Wochen davor bereit
>> lagen. Aber da hat sich das Zeug ja anscheind kaum jemand angeschaut.
>
> Diese Aussage kann man auch so auffassen: Um OpenGeoDB zu puschen, wurde
> OSM missbraucht und mit tonnenweise Tags wo OpenGeoDB erwähnt wird
> überschüttet. Um die Effizienz zu steigern, wurden Stadtnamen doppelt
> eingefügt, damit die Leute sich wirklich mit seinen Tags beschäftigen
> müssen.

Kann es sein, dass du in deinem Zorn mit deinen Unterstellungen weit 
über das Ziel hinausschiesst?

> Ich will ihn jetzt nichts unterstellen.

Genau so klingt es aber.

> Von meiner Gegend kann ich sagen, dass durch den Import drei Orte dazu
> gekommen sind, vier doppelt waren, und in einem Punkt fünf Orte
> vereinigt wurden. Und die Orte, die dazugekommen sind, liegen sehr weit
> weg von der Hauptstraße. Vertrauenswürdige Daten sind etwas anders.

Von welchem Ort sprichst du? Hast du in der opengeodb selbst mal 
nachgesehen, wie viele Orte da eingetragen sind?

> BTW: Es war von einer OpenGeoDB FAQ für den OSM Import die rede. Wo
> findet man die eigentlich?

http://wiki.openstreetmap.org/index.php/OpenGeoDB

> Abschließend möchte ich sagen, dass ich die einmalige Import-Idee zwar
> prinzipiell gut finde.

Prinzipiell ja. Leider gab's dabei einige Missverständnisse. Ich würde 
bedauern, wenn Sven dadurch vergrault wäre - denn er hat sich in letzter 
Zeit mit Kommentaren dazu sehr rar gemacht?

Es gab eine Reihe konstruktiver Vorschläge dazu. Bei all der Unruhe, die 
es aufgewirbelt hat, wäre meine Empfehlung:

- alles, was durch den Import reinkam und seither nicht verändert wurde, 
wird wieder rausgenommen. Damit werden wir etliche Duplikate los.

- Sven hat einen unglücklichen Zwischenstand genommen, der gerade durch 
das Zusammenwachsen von OSM und opengeodb entstand. Dadurch, dass ich 
parallel dazu erstmalig OSM und opengeodb abglich, dass damit OSM-Daten 
in die opengeodb einflossen und der dump-Mechanismus keinerlei 
Mechanismen vorsah, die dann nötige CC-Lizenz zu deklarieren, konnte ich 
keine neuen SQL-Dumps erstellen, auch wenn die Daten selbst schon 
korrigiert waren (z.B. Duplikate von Koordinaten)

Inzwischen sind die OSM-Daten wieder von den opengeodb-Daten getrennt 
und können als eigener SQL-Dump optional und unter CC hinzugefügt 
werden. Entsprechend könnte Sven auch einen neuen Import starten, da 
seit seiner Aktion sich die Datenmenge nochmals erheblich geändert hat.

- Meine Empfehlung ist, zum Abgleich auf bestehende Daten nur die kurze 
Schreibweise des Namens zu verwendet, die von der opengeodb parallel zur 
langen Schreibweise angeboten wird.

- Meine Empfehlung wäre auch, nicht alles aus der opengeodb in die OSM 
zu pumpen. Ich würde mich auf Orte und Ortsteile beschränken, Gemeinden 
dort, wo kein entsprechender Ort existiert.

Dass ein Grossteil der opengeodb-Daten mit recht ungenauen Koordinaten 
daherkommt, war zuvor schon bekannt. Hätte der Abgleich funktioniert, 
wäre das auch weit weniger aufgefallen, da dann ja die funktionierenden 
OSM-Koordinaten beibehalten worden wären. opengeodb-Daten stammen 
ursprünglich aus einer Quelle, die nur im Zehntelminuten-Raster 
aufgelöst war - und selbst da lag der Ort manchmal auf diesem Raster 
eher ungeschickt (Beispiel Unterhaching/Thalkirchen).

> Die Idee, dass es regelmäßige Imports geben
> sollte und die Mapper von OSM darauf Rücksicht nehmen müssen, halte ich
> persönlich für sehr frustrierend. Wenn ich einen Ort-Tag an eine
> bestimmte Position verschiebe, weiß ich, warum ich das tue. Und ich
> halte meine Daten dann für genauer als die OpenGeoDB Datenbank mit 5
> Orten in einem Punkt.

Ein neuer Import sollte alte Daten überhaupt nicht berühren. Ich 
befürchte derzeit, dass die OSM-Lizenzbedingungen verbieten, dass deine 
persönliche, bessere Wahl wieder in die opengeodb zurück übertragen 
werden kann, weil die opengeodb public domain bleiben sollte. Sie 
fliesst dort also erst dadurch ein, dass du selbst die Koordinaten auch 
dort korrigieren würdest.

Schönen Gruß
Martin




Mehr Informationen über die Mailingliste Talk-de