[Talk-de] Anonymisierungs-Tool für gpx-Dateien gesucht

Johann H. Addicks addicks at gmx.net
Di Sep 28 18:02:00 UTC 2010


>> Dann hast Du immernoch in den Tracks
>> - Geschwindigkeiten (selbst wenn keine Timestamps dran sind,
>> Aufzeichnungsrate ist nunmal 1s oder ein Vielfaches davon)
>> - Start und Ziel

> Inwiefern sind die Geschwindigkeiten für die Anonymisierung relevant?

Weil es vielleicht Leute gibt, die an bestimmten Stellen konsequent mit etwas  
schwerem Fuß unterwegs sind?
(Klar, das muss man nicht gutheißen. Man kann von solchen Rowdies z.B. zur  
Strafe keine Trackspenden annehmen...)

> Start und Ziel schneiden die meisten sowieso ein bischen weg, wichtig

Ich habe weder Lust noch Zeit an mehreren Tausend Tracks auch nur irgendwas  
manuell herumzuschnippeln.
Entweder geht das automatisch oder gar nicht.

>> Sprich: Wenn Du es wirklich anonymisieren wolltest, dann müsstest Du
>>
>> a) Stellen herausschneiden, wo über einen Zeitraum von >2 Minuten ein
>> Fläche mit dem Radius von 40m nicht verlassen wurde. Tracks an diesen
>> Stellen in getrennte Tracks aufspalten und den Stillstand herauslöschen.

> Solche Stellen sind ja eigentlich nur Start und Ziel und evtl
> Zwischenstationen. Dort schnippelt man aber sowieso meistens.

Welches Tool tut das bei Dir vollautomatisch?

>> b) eine größere Anzahl von Tracks nehmen und diese in Tiles
>> zerschneiden. (z.B. 5*5km)  Dann die Tracks innerhalb in ein GPX-File
>> zusammenfassen

> Zerschnitten werden müssen die originalen gpx-Tracks auf jeden Fall, das
> stimmt. Aber wieso meinst du dass sie mit benachbarten Stücken in einem
> Tile gruppiert werden müssen? Wo ist der Vorteil gegenüber den einzelnen
> Stücken?

Weil Du dann Tracks von unterschiedlichen Spendern vermischst.

>> c) die Tracks per Spline-interpolation "oversamplen", also
>> "Zwischenpunkte erfinden". Dann aus diesen Punkten mit einer gleitenden
>> Geschwindigkeitsdrift (+/-30%) wieder passende im dann (neuen)
>> Sekundenabstand auswählen.

> Was soll das bringen?

Die Geschwindigkeit eliminieren.


> Ein Verändern der Koordinaten halte ich nicht für
> klug, da man somit das eigentliche Messergebnis verfälscht.

Tut es nicht.
http://de.wikipedia.org/wiki/Spline-Interpolation


Und der sich hier parallel entspinnende Thread "Ich tracke nach Abstand" oder  
"ich tracke irgendwie optimiert" ist lächerlich.
Kein mir bekannter Empfänger arbeitet mit einem anderen Basisintervall (im  
GPX-Output) als 1s. (Auch nicht die eine GPS-Maus die intern 4Hz beherrscht,  
das aber nicht loggen kann...)
d.h. Wenn das Grundintervall 1s ist, dann lässt sich auch bei gelöschtem  
Timestamp allein auf Grundlage der Plausibilität (mögliche Beschleunigung  
eines KFZ) auch aus einem "punktoptimierten Track" die  
Geschwindigkeitsinformation zurückholen, sofern die Punkte nicht so radikal  
ausgedünnt worden sind, dass die Sekunden-Quantelung auch in Kurven nicht  
mehr sichtbar ist und der Track somit auch für OSM eigentlich unbrauchbar  
ist. (Abgesehen davon lautet die Empfehlung nach wie vor für alle Tracklogs:  
"Sekundenintervall bitte")



>> d) Trackstart auf einen random-Zeitwert +/- 2 Monate setzen, damit es
>> für die Josm-Mapper uperhaupt noch angezeigte Geschwindigkeitsfarben gibt.

> Die Geschwindigkeit ist nur von der Differenz der Zeitstempel abh??gig.
> Wenn ich dem Stempel einen zufälligen Offset verpasse, oder gleich alle
> gpx-Track bei 1970-01-01 anfangen lasse, dann ist die Zeitkomponente
> komplett aus dem Spiel.

Wenn Du die Zeit imkomplett verdrehst wie soll denn ein Mapper wissen, ob der  
anonyme Tracklogger einen Straßenverlauf vor- oder nach einem Baumaßnahme  
getrackt hat?

Ich kann es leider nur nochmal wiederholen: Es gibt viele potentielle  
Trackspender "im gewerblichen Umfeld", die aber nicht spenden wollen, weil  
sie nicht möchten, dass das eigene Verhalten (oder das ihrer Kollegen/ 
Mitarbeiter) durchleuchtbar wird.

Wenn die OSM-Community sagt "Nein, wir möchten nur Tracks von Leuten, die  
auch selbst mappen", dann ist das eine Meinung, die durchaus akzeptabel ist.
Zu sagen "richtige Anonymisierung ist überflüssig, aber gebt mal her die  
Tracks, wird schon keine Probleme geben" ist jedoch etwas, was nicht dazu  
führt, dass es besonders viele Trackspenden gibt.

-jha-







Mehr Informationen über die Mailingliste Talk-de