[Talk-cz] Fwd: [OpenStreetMap] duplicate nodes
MP
singularita na gmail.com
Neděle Listopad 14 21:21:00 UTC 2010
On Sun, 14 Nov 2010 21:12:18 +0100, "Petr Morávek [Xificurk]"
<xificurk na gmail.com> wrote:
> Jo, určitě... mě jen zajímalo jestli to někdo nemá zautomatizované.
> Na duplicitní cesty jsem si něco napsal, tak to použiuju na bažiny.
> Ale
> hledání duplicitních nodů takhle v místech dělení cest moc snadné
> není.
Mám skript co do něj nacpu dump a vyjede mi mapa, kde jsou vidět
duplicitní nody (resp pokud je tam N duplicitních bodů, tak se jich na
výstup posledních N-1 zkopíruje). Tohle pak lze otevřít v JOSM a podle
toho si vybírat kde se na to podívat, ale přímo z toho výsledku to
opravovat nelze (většina nodů je zároveň součástí nějakých cest). Teď je
to asi 45000 nodů jako vedlejší důsledek všech duplicit v dibavodu.
Výsledek je na http://git.wz.cz/dup_nodes_cz.osm.bz2 pokud by někoho
zajímalo, kde ty duplicity jsou. Stručně řečeno jsou skoro všude.
> honny napsal(a):
>> Ve volných chvílích (v místech, kde zrovna něco mapuju) promazávám
>> zdvojený objekty - mám v tom teda pokračovat? Nic automatickýho
>> nemám.
>> :) Já jen jestli v tom nedělám zmatek třeba.
Teď jsem si napsat obdobný skript i na vyhledávání duplicitních cest
(celkem to našlo asi 14 000 případů duplicitních cest v ČR), ale spousta
jich tam už není. Vypadá to, že velké množství duplikací je (bylo) v
pruhu mezi 17. a 18. stupněm.
Když jsem zjišťoval jestli je chyba ve skriptu, nebo jestli to někdo
opravuje, tak jsem narazil na tohle:
http://www.openstreetmap.org/browse/changeset/6362586
Vypadá to, že ty duplicity v ČR už někdo řeší (aspoň pro potoky), tak
bych ho nechal ho to dořešit. Jinak duplicitních bažin je asi 5000, při
hromadném odstraňování by to chtělo být opatrný, aby se nakonec
neodstranily obě kopie (někdo smaže první z těch duplicit, někdo tu
druhou a nebude tam ani jedna). Validator v JOSM při odstraňování
duplicitních cest postupuje deterministicky (z duplicitních cest nechá
tu z nejnižším ID, tedy tu co tam byla první, a zbylé smaže), ten kdo
řeší potoky, tak na to jde co jsem koukal asi stejně (zdá se, že používá
JOSM). Takže pokud by to někdo dělal, doporučuju, aby použil buď taky
JOSM, nebo aspoň stejný algoritmus (z duplikátů tu s nejnižším ID
nechat, smazat ty zbylé)
Já bych v tom promazávání během regulérního opravování pokračoval,
aspoň je pak vidět kde ještě nikdo nic neopravoval (tam kde jsou
zdvojené věci) a kde už jo (tam kde nic duplicitního není). Navíc v JOSM
je smazání duplicitních v aktuálně staženém výřezu záležitost asi na 3
kliknutí ve validatoru.
Martin
Další informace o konferenci talk-cz