[Talk-de] Koennen wir die TMC-Daten rauswerfen?
Frederik Ramm
frederik at remote.org
Mi Feb 2 10:10:25 UTC 2011
Hallo,
ich aegere mich ziemlich ueber die TMC-Daten in der OSM-Datenbank.
Ich habe nicht die Uebersicht, wer da alles dran arbeitet und dran
gearbeitet hat, also es besteht die Gefahr, dass ich jetzt einigen
ehrbaren Mappern auf die Fuesse trete, aber wenn's nach mir geht, muss
das Zeug raus.
Wir haben fast aussschliesslich menschenlesbare Daten in OSM. Schnapp
Dir ein beliebiges Objekt, und Du kannst in aller Regel verstehen, was
die Tags daran bedeuten.
Wir sind keine Datenbank fuer irgendwelche externen Daten, die in OSM
nicht wartbar sind, Daten, die man im RL nicht verifizieren kann.
Vielleicht kann mir mal einer den folgenden Vorgang erklaeren.
Da ist also eine harmlose Ampel in Dortmund, Node-ID 270090818, getaggt
als highway=traffic_signals.
Dann kommt am 31, Januar der User "ruhri" daher und ergaenzt das Tag:
TMC:cid_58:tabcd_1:LocationCode = 47739
Wo hat er das her? Steht das auf einem Aufkleber an der Ampel? Wenn
nicht (wenn es aus einer externen Liste/Datenbank kommt), warum muss das
dann in OSM stehen - kann das nicht derjenige, der die Daten auswerten
will, dann aus genau dieser externen Liste hinzufuegen?
Fuenf Stunden spaeter kommt ein "TMCbot" - der uebrigens, soweit ich
sehen kann, keiner der ueblichen Anforderungen an Bots genuegt - und
behauptet qua Changeset-Kommentar: "Korrektur von Schreib- und
Datenintegritätsfehlern in Key/Value-Paaren des deutschen TMC Schemas".
Was er aber tatsaechlich tut, ist, noch drei weitere Tags hinzuzufugegen:
TMC:cid_58:tabcd_1:Class = Point
TMC:cid_58:tabcd_1:LCLversion = 9.00
TMC:cid_58:tabcd_1:PrevLocationCode = 28866
Wo hat er sich die jetzt wieder hergeholt? Ist es nicht offensichtlich,
dass es sich bei diesem Node um einen "Point" handelt? Was besagt diese
LCLversion, und woher weiss der Bot, dass der User "ruhri" 9.00 gemeint hat?
Grundsaetzlich bin ich ja fuer Anarchie beim Tagging. Aber was wir hier
haben, ist ganz offensichtlich irgendeine externe Spezialdatenbank, die
unter massiven Eingriffen in OSM irgendwie auf OSM abgebildet wird, und
zwar so, dass man nicht nur tonnenweise unverstaendlichen Code in OSM
kippen muss (highway=traffic_signals versteht jeder, aber
TMC:cid_58:tabcd_1 versteht nur ein Computer), sondern auch noch
taeglich Bots laufen lassen muss, um diese Daten irgendwie in Schuss zu
halten.
Wenn jemand ein paar tausend Fotos hat und an irgendwelche Nodes in
Deutschland sowas dranpappt wie "foto_url=...", dann sagt ja keiner was
(das versteht vorallem auch jeder). Aber von diesen TMC-Tags gibt es
mittlerweile 175000 in Deutschland.
Die Botschaft, die bei einem neuen Mapper da ankommt, ist doch: "Oh, ein
kryptisch getaggtes Objekt. Das fass ich mal lieber nicht an."
Mir erschliesst sich der Nutzen dieser Tags nicht - kann mir jemand mal
eine praktische Anwendung zeigen, die diese Tags benutzt?
Mir sieht das nach einem grossangelegten Designfehler aus. Da haette man
von vornherein ein OSM-externes Mapping TMC<->OSM bauen muessen, statt
praktisch die ganze TMC-Datenbank auf OSM aufzupropfen.
Ich will jetzt nicht die Revolution anzetteln und morgen alle TMC-Daten
loeschen (und ich aergere mich, dass ich der Geschichte nicht viel
frueher widersprochen habe). Aber wenn es nicht irgendwelche
ueberwaeltigenden Gruende dafuer gibt, warum diese Daten in OSM bleiben
muessen, dann bin ich sehr dafuer, dass diejenigen, die diese Daten
verwenden, sich da irgendwie etwas basteln, was weniger "invasiv" ist.
Wenn jetzt an einem Objekt z.B. nur eine TMC-ID dranstehen wuerde und
alles weitere - was fuer eine Klasse, was ist die naechste ID, die
vorherige ID, wassweissich - waere extern, koennte man damit ja schon leben.
Ich suche also sozusagen eine "Exit-Strategie". Ich will herausfinden,
was und wem diese Daten nutzen, und dann ein Konzept machen, wie wir die
Daten aus OSM entfernen koennen, ohne diesen Nutzen zu ruinieren.
Ausser natuerlich, alle ausser mir finden diese TMC-Daten ganz knorke
und haetten lieber noch viel mehr Tags der Art
BPF:grq_23:tiwwhs_2:MegaCode = 281763.
Bye
Frederik
Mehr Informationen über die Mailingliste Talk-de