[Talk-de] Koennen wir die TMC-Daten rauswerfen?

Frederik Ramm frederik at remote.org
Mi Feb 2 10:10:25 UTC 2011


Hallo,

    ich aegere mich ziemlich ueber die TMC-Daten in der OSM-Datenbank. 
Ich habe nicht die Uebersicht, wer da alles dran arbeitet und dran 
gearbeitet hat, also es besteht die Gefahr, dass ich jetzt einigen 
ehrbaren Mappern auf die Fuesse trete, aber wenn's nach mir geht, muss 
das Zeug raus.

Wir haben fast aussschliesslich menschenlesbare Daten in OSM. Schnapp 
Dir ein beliebiges Objekt, und Du kannst in aller Regel verstehen, was 
die Tags daran bedeuten.

Wir sind keine Datenbank fuer irgendwelche externen Daten, die in OSM 
nicht wartbar sind, Daten, die man im RL nicht verifizieren kann.

Vielleicht kann mir mal einer den folgenden Vorgang erklaeren.

Da ist also eine harmlose Ampel in Dortmund, Node-ID 270090818, getaggt 
als highway=traffic_signals.

Dann kommt am 31, Januar der User "ruhri" daher und ergaenzt das Tag:

TMC:cid_58:tabcd_1:LocationCode = 47739

Wo hat er das her? Steht das auf einem Aufkleber an der Ampel? Wenn 
nicht (wenn es aus einer externen Liste/Datenbank kommt), warum muss das 
dann in OSM stehen - kann das nicht derjenige, der die Daten auswerten 
will, dann aus genau dieser externen Liste hinzufuegen?

Fuenf Stunden spaeter kommt ein "TMCbot" - der uebrigens, soweit ich 
sehen kann, keiner der ueblichen Anforderungen an Bots genuegt - und 
behauptet qua Changeset-Kommentar: "Korrektur von Schreib- und 
Datenintegritätsfehlern in Key/Value-Paaren des deutschen TMC Schemas". 
Was er aber tatsaechlich tut, ist, noch drei weitere Tags hinzuzufugegen:
	
TMC:cid_58:tabcd_1:Class = Point
TMC:cid_58:tabcd_1:LCLversion = 9.00
TMC:cid_58:tabcd_1:PrevLocationCode = 28866

Wo hat er sich die jetzt wieder hergeholt? Ist es nicht offensichtlich, 
dass es sich bei diesem Node um einen "Point" handelt? Was besagt diese 
LCLversion, und woher weiss der Bot, dass der User "ruhri" 9.00 gemeint hat?

Grundsaetzlich bin ich ja fuer Anarchie beim Tagging. Aber was wir hier 
haben, ist ganz offensichtlich irgendeine externe Spezialdatenbank, die 
unter massiven Eingriffen in OSM irgendwie auf OSM abgebildet wird, und 
zwar so, dass man nicht nur tonnenweise unverstaendlichen Code in OSM 
kippen muss (highway=traffic_signals versteht jeder, aber 
TMC:cid_58:tabcd_1 versteht nur ein Computer), sondern auch noch 
taeglich Bots laufen lassen muss, um diese Daten irgendwie in Schuss zu 
halten.

Wenn jemand ein paar tausend Fotos hat und an irgendwelche Nodes in 
Deutschland sowas dranpappt wie "foto_url=...", dann sagt ja keiner was 
(das versteht vorallem auch jeder). Aber von diesen TMC-Tags gibt es 
mittlerweile 175000 in Deutschland.

Die Botschaft, die bei einem neuen Mapper da ankommt, ist doch: "Oh, ein 
kryptisch getaggtes Objekt. Das fass ich mal lieber nicht an."

Mir erschliesst sich der Nutzen dieser Tags nicht - kann mir jemand mal 
eine praktische Anwendung zeigen, die diese Tags benutzt?

Mir sieht das nach einem grossangelegten Designfehler aus. Da haette man 
von vornherein ein OSM-externes Mapping TMC<->OSM bauen muessen, statt 
praktisch die ganze TMC-Datenbank auf OSM aufzupropfen.

Ich will jetzt nicht die Revolution anzetteln und morgen alle TMC-Daten 
loeschen (und ich aergere mich, dass ich der Geschichte nicht viel 
frueher widersprochen habe). Aber wenn es nicht irgendwelche 
ueberwaeltigenden Gruende dafuer gibt, warum diese Daten in OSM bleiben 
muessen, dann bin ich sehr dafuer, dass diejenigen, die diese Daten 
verwenden, sich da irgendwie etwas basteln, was weniger "invasiv" ist. 
Wenn jetzt an einem Objekt z.B. nur eine TMC-ID dranstehen wuerde und 
alles weitere - was fuer eine Klasse, was ist die naechste ID, die 
vorherige ID, wassweissich - waere extern, koennte man damit ja schon leben.

Ich suche also sozusagen eine "Exit-Strategie". Ich will herausfinden, 
was und wem diese Daten nutzen, und dann ein Konzept machen, wie wir die 
Daten aus OSM entfernen koennen, ohne diesen Nutzen zu ruinieren.

Ausser natuerlich, alle ausser mir finden diese TMC-Daten ganz knorke 
und haetten lieber noch viel mehr Tags der Art 
BPF:grq_23:tiwwhs_2:MegaCode = 281763.

Bye
Frederik




Mehr Informationen über die Mailingliste Talk-de