[Talk-de] Relationen aus der Sicht der Auswertung - Segen oder Fluch??

Peter Wendorff wendorff at uni-paderborn.de
So Jul 8 09:26:52 UTC 2012


Am 08.07.2012 11:02, schrieb Roland Olbricht:
> Hallo zusammen,
>
>> Es geht konkret um ein Zenario was Relationen und Hausnummern betrifft
>> und nachfolgend bitte keine Diskussion über "diese Relation ist aber
>> doof, weil ...". Es geht um die Frage wie ist soetwas überhaupt
>> vernünftig und performant in der Auswertung zu realisieren. Das Beispiel
>> kann sicherlich auch auf andere Relationen übertragen werden. Immer
>> werden verschiedene Elemente bei Relationen zusammengeführt die
>> irgendetwas gemeinsam haben und man so verhindern will das Redundante
>> Daten entstehen.
> Wiederholte Tag-Werte sind keineswegs eine Belastung, sondern werden in der
> Regel höchst effizient verarbeitet.
>
> Der Grund dafür ist, dass dies in den OSM-Daten sehr häufig vorkommt:
> Straßennamen sind stets eingetragen als gleiche name=irgendwas-Werte von
> beieinander liegenden Ways.
>
> Weil dies so extrem häufig ist, hat jede nahezu Software, die OSM-Daten
> verarbeitet, irgendeine Form von Kompression gleicher Tag-Werte. Z.B. werden
> die Tag-Werte in eine separate Tabelle ausgelagert, es gibt ein Dictionary, in
> dem die vorkommenden Werte eingetragen werden oder ähnliches.
>
> Umgekehrt werden Relationen deutlich seltener verwendet, auf sehr verschiedene
> Weisen (siehe Jochens eMail) und sind daher nicht so sehr durchoptimiert.
>
> Es ist daher auch noch niemand auf die Idee gekommen, jede Straße als eine
> eigene Relation zu schreiben, um den Straßennamen nicht redundant zu
> speichern.
...abgesehen von Ausnahmen wie z.B. Autobahnen, bei denen das IMHO auch 
nicht notwendig wäre.

Gruß
Peter




Mehr Informationen über die Mailingliste Talk-de