[Talk-de] Alpha: OpenGeoDB -> OSM

Martin Trautmann traut at gmx.de
Mi Jan 9 16:17:36 UTC 2008


In-Reply-To: <fm2oc0$g9o$1 at ger.gmane.org>

On 2008-01-09 16:14, Andreas Hubel wrote:
> Also wenn ich mir das so anschaue, würde ich nicht alle Daten der
> OpenGeoDB direkt übernehmen.

Das waere vor allem dann verkehrt, wenn man diese Daten direkt aus der
opengeodb holen wollte, statt sie gleich der OSM mitzugeben - das fuehrt
nur zu einer Verdoppelung der Daten und verhindert gleichzeitig, dass
Änderung zurückfliessen würden.

> ich denke die ganzen is_in Felder sollte man raus lassen. is_in kommt
> aus der Zeit in der es noch keine Relations gab. Ich denke das Tag
> sollte man irgendwie als veraltet oder so kennzeichnen.

Im Gegenteil steckt genau im originalen part_of die Relation drin, weil hier
die loc_id des naechsten opengeodb-Eintrags steckt. Svens Beispiel scheint
das flachzuklopfen (part_of / Teil von / is_in_loc_id gegenueber is_in)


> openGeoDB:sort_name würde ich rauslassen und falls openGeoDB:ISO-3166-2
> sowas die de für Deutschland ist würde ich das als iso_contry_code oder
> nur iso_code kennzeichnen.

http://wiki.openstreetmap.org/index.php/User:OpenGeoDB nennt hier
500100001       name

Tatsaechlich steckt der eigentliche Name in 500100000 (vergleiche
<http://kent.dl.sourceforge.net/sourceforge/opengeodb/Constants.txt>
wo noch die Konstanten der Version 0.2.4 beschrieben werden - die 400*
kamen mit 0.2.5 und 0.2.6 erst hinzu)

In der "Name" (500100000:NAME) steckt die vollstaendige Namensbezeichnung drin,
wie z.B. "Freiburg im Breisgau".

Die 500100001 wird derzeit nicht wirklich genutzt.
Interessant ist eher die 500100002, die 7Bit-Schreibweise, beschraenkt auf
den Basisteil wie "freiburg" (lower case, no Umlauts, no extensions)


> openGeoDB:type, openGeoDB:layer, openGeoDB:location sind Teilweise
> einfach redundant und sagen das selbe aus. Eigendlich sollte man das via
>   place=xyz ausdrücken.

Die wiki-Seite sollte vielleicht mit einem Beispiel gefuettert werden

type: Stadt, Landkreis, Gemeinde, Stadtviertel, Stadtbezirk, Ortsteil, ...

layer: das gibt die Hierarchie-Ebene an.

Beispielsweise gibt es Hamburg als Bundesland (AGS 02, layer 3), als
Landkreis (AGS 02000, layer 5) und als Gemeinde (AGS 02000000, layer 6)

Auf layer 4 liegen die Regierungsbezirke, auf layer 7 die Orte, auf layer
8 die Ortsteile, auf 9 die Strassen, auf 10 Einzeladressen

Durch "Teil von" (part of, is_of) und "Ebene" (level, layer) wird
ausreichend genau beschrieben, wo im Baum das ganze hierarchisch haengt.

> Ist openGeoDB:name und name wirklich nötig? Nur name würde doch reichen.

solange beides identisch ist, reicht name. Den openGeoDB-Name wuerde ich
nur bei Abweichungen nenne, so wie z.B. auch einen abweichenden
wikipedia-Name:

   name=freiburg
   opengeodb:name=Freiburg im Breisgau
   wikipedia:de=Freiburg_im_Breisgau

> openGeoDB:version ist meiner Meinung nach mit "0.2.6.11 / 2007-12-04 /
> http://fa-technik.adfc.de/code/opengeodb/dump/" zu lang. Nur die Version
> "0.2.6.11" sollte reichen.

Ja, genau - wobei auf fa-technik.adfc.de beliebige zwischendumps moeglich
sind, teils direkt durch Benutzerwunsch. Von daher waere 0.2.6.11_2007-12-04 oder 02611_20071204 sinnvoll.

> openGeoDB:license_plate_code = "BW" für BaWü ist irgendwie seltsam,

Offiziell heisst das car_licence_code. Solche gibt es eigentlich nur
auf Kreisebene (z.B. FR: Stadt Freiburg und Landkreis Breisgau im
Schwarzwald) bzw. die Ebenen darunter. Auf Bundesland-Ebene steckt in dem
Feld einfach nur eine Abkuerzung.

> generell find ich die Übersetung irgendwie seltsam. Zumal das sowieso
> nur für Deutschland eindeutig ist. Ich wäre da fast für einen Deutschen
> Namensraum, z.B. de:KFZ. Analog dazu bei den Gemeindeschlüsseln de:AGS.

> Was haltet ihr davon?

IMHO fuer OSM wichtig ist vor allem die loc_id als Referenz zur opengeodb
selbst. Hilfreich erscheint mir die
part_of / is_in_locid / Teil von / 400100000 wie auch die
AGS / community_identification_number / Gemeindeschlüssel / 500600000

level / layer / Ebene / 400200000 ist für die Hierarchien in der openbeodb
wichtig und steckt in Deutschland bis zur Gemeindeebene auch implizit im
AGS (zweistellig: Bundesland bis achtstellig: Gemeinde). Es gibt die
Überlegungen, den AGS auch als nicht-amtlichen oder halb-amtlichen
Gemeindeschlüssel bis ganz nach unten durchzuziehen. Beispielsweise gibt
es amtliche fünfstellige Strassenschlüssel, also 13stellige Schlüssel für
jede einzelne (Gemeinde-)Strasse in Deutschland.

Postleitzahlen sind einerseits sehr attraktiv, andererseits aber sehr
problematisch: für eine korrekte Zuordnung müsste man in der OSM eine
durchgehende Strasse tatsächlich an der PLZ-Grenze trennen. Es kann sogar
sein, dass eine Strasse zu einer PLZ gehört, die Anschriften an dieser
Strasse aber durch die postalische Zuordnung ganz anderen PLZ-Einträgen
zugeordnet sind - in Österreich scheint das gängige Praxis zu sein.

Von den Namesvarianten würde ich nur
name / 500100000 verwenden, je nach Bedarf auch
NAME_7BITLC / sort_name / ASCII / 500100002

Die anderen Namensvarianten sind wenig interessant. Hier muss aber darauf
hingewiesen werden, dass es auch landesspezifische Varianten gibt, z.B.

   opengeodb:name=Deutschland
   opengeodb:name:en=Germany
   opengeodb:name:fi=Saksa
   opengeodb:name:he=גרמניה
   usw.

Bei Daten wie population / 600700000 muss beachtet werden, dass solche
Daten in der opengeodb in der Regel mit einer Datumsangabe kombiniert sind
- z.B. gültig am Stichtag 2006-12-31 (genauer: von 2006-12-31 bis
2006-12-31).

Diese Datumsangabe ist bei jedem einzelnen Eintrag dabei, wird aber nicht
immer genutzt und benötigt (dummy-Daten). Gerade Einwohnerzahlen sind Angaben, die die
Kombination mit einem Datum benötigen.

Schoenen Gruss
Martin

-- 
Psssst! Schon vom neuen GMX MultiMessenger gehört?
Der kann`s mit allen: http://www.gmx.net/de/go/multimessenger?did=10




Mehr Informationen über die Mailingliste Talk-de