[Talk-cz] Fwd: [OpenStreetMap] duplicate nodes

MP singularita na gmail.com
Neděle Listopad 14 21:21:00 UTC 2010


 On Sun, 14 Nov 2010 21:12:18 +0100, "Petr Morávek [Xificurk]" 
 <xificurk na gmail.com> wrote:
> Jo, určitě... mě jen zajímalo jestli to někdo nemá zautomatizované.
> Na duplicitní cesty jsem si něco napsal, tak to použiuju na bažiny. 
> Ale
> hledání duplicitních nodů takhle v místech dělení cest moc snadné 
> není.

 Mám skript co do něj nacpu dump a vyjede mi mapa, kde jsou vidět 
 duplicitní nody (resp pokud je tam N duplicitních bodů, tak se jich na 
 výstup posledních N-1 zkopíruje). Tohle pak lze otevřít v JOSM a podle 
 toho si vybírat kde se na to podívat, ale přímo z toho výsledku to 
 opravovat nelze (většina nodů je zároveň součástí nějakých cest). Teď je 
 to asi 45000 nodů jako vedlejší důsledek všech duplicit v dibavodu.

 Výsledek je na http://git.wz.cz/dup_nodes_cz.osm.bz2 pokud by někoho 
 zajímalo, kde ty duplicity jsou. Stručně řečeno jsou skoro všude.

> honny napsal(a):
>> Ve volných chvílích (v místech, kde zrovna něco mapuju) promazávám
>> zdvojený objekty - mám v tom teda pokračovat? Nic automatickýho 
>> nemám.
>> :) Já jen jestli v tom nedělám zmatek třeba.

 Teď jsem si napsat obdobný skript i na vyhledávání duplicitních cest 
 (celkem to našlo asi 14 000 případů duplicitních cest v ČR), ale spousta 
 jich tam už není. Vypadá to, že velké množství duplikací  je (bylo) v 
 pruhu mezi 17. a 18. stupněm.

 Když jsem zjišťoval jestli je chyba ve skriptu, nebo jestli to někdo 
 opravuje, tak jsem narazil na tohle:
 http://www.openstreetmap.org/browse/changeset/6362586

 Vypadá to, že ty duplicity v ČR už někdo řeší (aspoň pro potoky), tak 
 bych ho nechal ho to dořešit. Jinak duplicitních bažin je asi 5000, při 
 hromadném odstraňování by to chtělo být opatrný, aby se nakonec 
 neodstranily obě kopie (někdo smaže první z těch duplicit, někdo tu 
 druhou a nebude tam ani jedna). Validator v JOSM při odstraňování 
 duplicitních cest postupuje deterministicky (z duplicitních cest nechá 
 tu z nejnižším ID, tedy tu co tam byla první, a zbylé smaže), ten kdo 
 řeší potoky, tak na to jde co jsem koukal asi stejně (zdá se, že používá 
 JOSM). Takže pokud by to někdo dělal, doporučuju, aby použil buď taky 
 JOSM, nebo aspoň stejný algoritmus (z duplikátů tu s nejnižším ID 
 nechat, smazat ty zbylé)

 Já bych v tom promazávání během regulérního opravování pokračoval, 
 aspoň je pak vidět kde ještě nikdo nic neopravoval (tam kde jsou 
 zdvojené věci) a kde už jo (tam kde nic duplicitního není). Navíc v JOSM 
 je smazání duplicitních v aktuálně staženém výřezu záležitost asi na 3 
 kliknutí ve validatoru.

 Martin




Další informace o konferenci talk-cz