[Talk-de] Relationen für Betreiber (und evtl. für alles?)

Jochen Topf jochen at remote.org
Fr Jun 10 07:01:29 UTC 2011


On Thu, Jun 09, 2011 at 08:06:49PM +0200, M∡rtin Koppenhoefer wrote:
> Ich habe gerade mal einen Versuch gemacht zu einer Idee, die mir schon
> länger durch den Kopf geht.
> 
> Ausgangspunkt war die Tatsache, dass wir keine eindeutigen Identifier
> (URI) für viele Dinge haben, so dass es z.B. von der Deutschen Post
> zig Varianten in der DB gibt, die man alle erst mal matchen muss. Auch
> wenn man das vollständig in den Griff bekommen könnte durch
> eindeutiges Matchen ohne jeden Zweifel, so hat man doch nur einen
> Namen und keine weiteren Informationen.
> 
> M.E. könnte OSM extrem dazugewinnen, wenn wir die "Struktur der Welt"
> auch im "nichträumlichen Bereich" in unserer Datenbank hätten. Wir
> könnten z.B. die Tätigkeitsfelder von Organisationen oder
> Geschäftsfelder von Firmen abbilden. Man könnte die DB z.B. fragen:
> welche Kraftwerke werden von EON betrieben, wo ist die
> Hauptverwaltung, wie ist die Telefonnummer, welche Firmen gehören noch
> dazu (Beteiligungen, Töchter, etc.). Auch politische Strukturen
> könnten vollständig abgebildet werden (Parlament, Regierungssitz,
> Hierarchie, etc.). Manches davon geht auch schon jetzt, aber nur
> "ungefähr", d.h. man verlässt sich auf gleiche Namen oder muss externe
> Recherchen anstellen und unsere mit anderen Daten verknüpfen.
> 
> Im Prinzip ist solches Mappen derzeit schon möglich, da man auch
> Relationen ohne Members machen kann, die z.B. eine Firma
> repräsentieren könnten. Das Problem ist vor allem, wie man diese
> Relationen auffinden kann ;-). Vermutlich ist unser derzeitiges
> db-Schema nicht besonders gut geeignet, um so was zu machen, aber wenn
> es Interesse daran gibt, wäre das vielleicht lösbar.
> 
> Ich habe mal ein kleines Beispiel gemacht, wie man so etwas abbilden könnte:
> Relation für eine Firma (nur rudimentär, da könnte natürlich viel mehr
> drin stehen)
> http://www.openstreetmap.org/browse/relation/1618278
> 
> und eine Metro-Linie, die von der vg. Firma betrieben wird (die
> Relation taucht hier mit der Rolle operator auf):
> http://www.openstreetmap.org/browse/relation/207926
> 
> Kommentare?

Aaargh. Das klingt auf den ersten Blick ja alles ganz toll. Alles superflexibel
und so. Aber irgendjemand muss mit den Daten auch arbeiten. Das sind einerseits
die Mapper, die das eintragen müssen und andererseits die Leute, die aus den
Daten Karten machen oder sonstwas. Und für beide ist diese ganze
Relationiererei furchtbar aufwändig.

Es hat schon seinen Grund, dass OSM so erfolgreich ist und andererseits
Projekte wie DBPedia und alle diese Semantik-Web-Kram-Sachen nicht in die
Puschen kommen. Es ist für Menschen schwierig rekursiv verzeigerte
Datenstrukturen zu verstehen. Und auch für Maschinen ist das enorm aufwändig,
damit zu arbeiten. Eine Software, die die wichtigsten drei, vier Varianten
von "Deutsche Post" aus den Operator-Tags der Briefkästen matcht ist viel
viel einfacher, als eine, die Relationen nachlaufen muss. Und dass sowas
mit Relationen eindeutiger wird, ist auch eine Illusion. Ich weiss nicht, ob
das jetzt noch ist, aber irgendwann hatten wir mal eine Hierarchie der
Stadtteile von Bremen doppelt in der Datenbank, weil halt nichts verhindert,
dass man sowas macht.

Nein, unsere Datenstruktur ist schon gut. Sie ist ein Kompromiss, aber ein
praktikabler Kompromiss. Und sie versucht nicht, die ganze Welt in einem
Datenmodell abzubilden, sondern nur die Geodaten für eine Karte zu sammeln.
Wir sind keine Datenbank für Firmengeschäftsfelder oder politische Strukturen.
Das soll ruhig jemand anderes machen.

Jochen
-- 
Jochen Topf  jochen at remote.org  http://www.remote.org/jochen/  +49-721-388298





Mehr Informationen über die Mailingliste Talk-de