[Talk-de] Open Data für Geobasisdaten in Baden-Württemberg

Martin Trautmann traut at gmx.de
Fr Apr 12 06:20:07 UTC 2013


On 13-04-12 1:02, Dietmar wrote:
> Hallo Martin,
> 
> Am 12.04.2013 00:33, schrieb Martin Trautmann:
>> On 13-04-11 23:56, Dietmar wrote:
>>> da fehlen die Gemeinden, die ich früher in diesem Thread
>>> gepostet habe, siehe [1]. Diese Liste wurde jetzt angefangen und wird
>>> auch fortgepflegt.
>>> [1] http://www.mail-archive.com/talk-de@openstreetmap.or/msg99961.html
>> Hätte da irgend ein Anhang dran sein sollen? Denn ich finde darin keine
>> Liste von Gemeinden, die dir noch fehlen würden.
> 
> Sorry, falscher Post-Link, hier der richtige [1]

ok, der deckt sich so weit mit meinen eigenen Ergebnissen.

>> Es fehlen noch komplett:
>> Ludwigsburg (Württemberg)
>> Rheinau
>> Sindelfingen
>> Tägermoos
>> Tübingen
>> Ulm
> 
> * Tägermoos: habe ich händisch herausgenommen, weil der angegebene
> amtliche Gemeindeschlüssel AGS in der 12/2012er Liste vom Statistischen
> Bundesamt nicht vorhanden war.
> Das liegt wohl an dem staatsrechtlichen Zustand, der in wikipedia
> beschrieben ist. Ich werde die Liste importieren, muß mir vorher noch
> anschauen, ob Deutschland oder der Schweiz zugehörig ;)

Etliche der Straßennamen haben den Zusatz "(CH)". Ich selbst habe sie
rausgenommen.

> * Sindelfingen (und auch Böblingen) da habe ich von früher sowohl eine
> Liste aus Florian Lohoffs als auch Sven Anders Auswertung vorliegen und
> hatte mal einen lokalen Mapper erfolglos angemailt.
> Generell habe ich keine händisch vorher vorhandene Straßenlisten
> überschrieben.
> * Ludwigsburg, Tübingen und Ulm: habe ich als fehlend gemeldet, ist aber
> von früher von Florian Lohoff als händische Liste drin. Evtl. ist da ein
> Datenfehler bzgl. Name und/oder AGS.


Ich kann verstehen, dass du keine Doppelungen drin haben willst - bei
meiner letzten Prüfung waren da eh' noch zu viele drin. Dann könntest du
aber in der Übersicht vermerken, was es mit denen auf sich hat. Für eine
erste Prüfung würde ich trotzdem die 2011er Daten hinzu nehmen.

> * Rheinau (Ortenaukreis) ist vorhanden aus der 2013er Liste, während
> Rheinau (gemeindefreies Gebiet) fehlt. Muß ich mir anschauen.

Stimmt, "Rheinau, gemeindefreies Gebiet" lohnt nicht.

>> So lange die 2013er Daten nicht besser sind würde ich beide Dateien
>> zusammenfassen. Das hat das Risiko, dass Löschungen, Korrekturen,
>> Umbenennungen aus der Periode 2011 bis 2013 darin weiter enthalten sind.
> 
> Wie zusammenfassen? Alle Straßen einer Gemeinde aus beiden Listen
> zusammenführen und echte Dubletten rauswerfen? Da werden vermutlich
> (ohne Prüfung) etliche verschiedene Schreibweise vorkommen. Welche nehme
> ich dann?

Die aktuellere - und du hast als großen Vorteil den Straßenschlüssel
dabei. Damit kannst du gleiches herausfinden.

Der Merge geht recht einfach so:

cat strassenschluessel_2013-04-04.csv
strassenschluessel_lika-db_2011-07-182.csv | sort -k 3,3 -k1,1 -u -t ";"
> strassenschluessel_merged.csv

Im direkten Vergleich finde ich 604 Umbenennungen in den Daten.

> Wenn wir die einfach zusammenfassen, haben wir keine klare Grundlage
> bzw. in dem Sinne die klare, das wir ein Mischmasch beider Quellen haben.

Ja, das ist so - aber was ist die bessere Alternative?

Schönen Gruß
Martin




Mehr Informationen über die Mailingliste Talk-de