[Talk-it-southtyrol] Address-Import - OpenGisData.eu
Martin Raifer
tyr.asd at gmail.com
Sun Aug 11 18:40:14 UTC 2013
Lieber Patrick, lieber Markus,
danke für eure flotte Reaktion und die Bereitschaft nachzubessern.
Wenn man Daten in OSM importiert geht es immer darum, dass das
gesamt-Projekt danach in einem "besseren" Zustand ist als vorher. Reine
Quantität an Daten ist nicht so wichtig, wenn die Community darunter
leidet, weil die Qualität der Daten nicht passt. Schlechte Daten
verschrecken Mapper - fehlende Daten hingegen regen neue User an
mitzumachen um die Daten einzutragen.
Genau deswegen und um technisch/organisatorische Details abzuklären gibt
es die Import Guidelines überhaupt. Ich bitte euch, diesmal wenigstens die
Checkliste gewissenhaft einzuhalten. Unter Anderem also das Vorhaben gut
zu dokumentieren, anzukündigen, das Tagging-Schema festzulegen und sich um
"Conflation"[1] zu kümmern.
Oft höre ich von euch den Satz: „so sind die Quelldaten einfach“. Das darf
keine Ausrede sein! Wenn die Quelldaten mangelhaft sind hat man genau zwei
Optionen: Entweder man behebt diese Mängel durch geeignete
Datenverarbeitung oder man unterlässt einen automatisierten Import. Ich
glaube aber nicht, dass wir hier vor unlösbaren Aufgaben stehen. Leider
kann ich nicht viel mehr konkret sagen, weil ich euer "Import-Tool" nicht
kenne, denn leider ist aus der angekündigten Veröffentlichung als
Open-Source offensichtlich auch (noch?) nichts geworden.
Aber hier ein paar Denkanstöße:
* Ich glaube ihr habt auch Zugriff auf alle anderen Geodaten der Provinz
Bozen. Jedenfalls gibt es im Geobrowser auch das Straßennetz mit korrekter
Großschreibung, sowie die Ortschaften. Damit könnte man die Ausgangsdaten
abgleichen.
* Auch in OSM gibt es so einige Straßennamen, die hilfreich sein könnten.
* Gemeindegrenzen gibt es auch in OSM und die Zuordnung der Reihenfolge
der Sprachen hat Wikipedia[2].
* Ich glaube nicht, dass es akzeptabel ist, Duplikate zu in OSM bereits
vorhandenen Adressen[3] einzutragen (evtl. mit der Ausnahme von Adressen,
die sich ausschließlich auf POIs beziehen oder Adressen, die in OSM
unvollständig sind). Dieser Abgleich könnte aber auch manuell vorgenommen
werden.
* Es ist sehr problematisch Projekt-interne IDs in OSM einzufügen. Mapper
müssen die Daten unabhängig nachprüfen können, optimalerweise vor Ort ("on
the ground rule") oder aber in anderen offenen Datensätzen (aber auch
solche IDs werden häufig nachträglich wieder entfernt [4]). Was soll ein
Mapper machen, wenn er z.B. aus Versehen eine Adresse gelöscht hat, und
dann wieder neu einträgt? Außerdem: Worin besteht der Vorteil einer
solchen ID für den Mapper und Datenkonsumenten? Dazu ist noch anzumerken,
dass eine Adresse an sich bereits eine eindeutige ID ist, wozu also noch
eine weitere?
* @Adressen ohne Straßennamen: Ich kenne die Situation in Rodeneck und im
Martelltal. Dort ist es so, dass die Straßen namenlos sind, es gibt dort
auch keine Straßennamen-Schilder, sondern nur Ortstafeln. In der Adresse
wird anstatt des Straßennamens der Fraktionsname verwendet. Hierfür
"addr:street" zu verwenden wäre schlicht falsch.
Sicher wird es mit einigem Aufwand verbunden sein, die Daten in eine
brauchbare Qualität zu bringen, allerdings wäre die einzige Alternative,
die mir einfällt, die folgende: Ihr veröffentlicht eure Daten so wie sie
sind und gebt die Erlaubnis, diese für OSM zu verwenden. Dann werden die
Daten vielleicht händisch von Mappern importiert.
Grüße
Martin
[1] http://wiki.openstreetmap.org/wiki/Conflation
[2] http://de.wikipedia.org/wiki/Südtirol#Sprachen_und_Dialekte
[3] http://overpass-turbo.eu/s/K9
[4] http://lists.openstreetmap.org/pipermail/talk-us/2012-July/008830.html
More information about the Talk-it-southtyrol
mailing list