[Talk-cz] Smazání duplicitních budov

Petr Vejsada osm na propsychology.cz
Neděle Říjen 12 20:41:29 UTC 2014


Ahoj,

tak nějaký pokrok - na http://pedro.poloha.net/osm/naplacane_budovy.csv je 
nová verze tabulky.

- opraven distinct, v té původní bylo všechno 2x, jednou jako a_osm_id a 
b_osm_id a podruhé obráceně
- přidáno datum, nick posledního editora a sloupec X_in3d (boolean), který 
říká, zda příslušná entita na sobě má nějaké 3D tagy, konkrétně se hledají 
'building:part' 'min_height' 'building:min_level'. Tagy zvoleny na základě 
http://wiki.openstreetmap.org/wiki/Simple_3D_Buildings

jzvc si cennou připomínkou zachránil budovu Boží prst, kterou editoval a na 
které nejsou tagy "layer".

Je to jediná budova, která se touto kontrolou ze zpracování vyřadila.

Máme tedy 2416 dvojic budov, které se překrývají o více než 50% minus dvě 
dvojice z Božího prstu. Když dáme cut-off na 80%, dělá to rovných 2000 dvojic.

Z výše uvedeného je asi 100 relací, což se dá zvládnout manuální kontrolou.

Celkem je v DB 11000 budov, které se vzájemně překrývají. Provedením plánované 
akce by se nám tento počet snížil o cca 4000, tedy na 7000 budov.

Po sobě jsem si už uklidil ručně, tedy jsem opravil jsem všechny překrývající 
se budovy, na které jsem sahal já nebo CzechAddress.

--
Petr

Dne Ne 12. října 2014 17:37:47, jzvc napsal(a):

> Dne 12.10.2014 17:32, Petr Vejsada napsal(a):
> > Ahoj,
> > 
> > díky za připomínky. Layer se kontroluje, obě budovy ve dvojici mají vždy
> > stejný layer. Musím si tedy něco načíst o těch 3D modelech.
> > 
> > Zachovat starší objekt, no to nevím. Ten nový objekt by měl být přesnější,
> > aktuálnější ... ?
> 
> Tim jsem mysel ve chvili, kdy nemas zadny dalsi kriterium pro vyber.
> 
> > --
> > Petr
> > 
> > Dne Ne 12. října 2014 17:20:48, jzvc napsal(a):
> >> Dne 12.10.2014 15:11, Petr Vejsada napsal(a):
> >>> Ahoj,
> >>> 
> >>> chystám se na další čistku. Jde o budovy, které jsou naplácané jedna na
> >>> druhé. Vzniklo to většinou asi ruianizací původních budov z KM. Netuším,
> >>> proč se původní budova nesmazala a jsou 2 naplácané na sobě (podobně
> >>> jako
> >>> v RUIAN) ;-)
> >>> 
> >>> 
> >>> Plán:
> >>> 
> >>> - nalézt dvojice, kde vzájemný geometrický průnik obou budov činí X%
> >>> větší
> >>> z nich (momentálně experimentuji s hodnotou 95%, našlo se cca 2600
> >>> dvojic; při hodnotě 80% se našlo 4000 dvojic)
> >>> 
> >>> - tagy ze starší budovy z dvojice (starší=byla editovaná před delší
> >>> dobou
> >>> než "mladší" budova) přenést na budovu mladší (pokud už tam nejsou)
> >>> 
> >>> - pokud není ve hře relace (starší budova sama o sobě není relací a není
> >>> členem relace), tak smazat - pouze cestu. Uzly bych nechal být a on už
> >>> by
> >>> je smazal ten skript, co tu pouštím na ty sirotky.
> >>> 
> >>> Jaké další zrádnosti v tom mohou být, na které jsem nepřišel?
> >> 
> >> Cus, tak hned prvni co me napada - 3D model. To muze (a ve vetsine
> >> pripadu bude) sada prekryvajicich se budov, prevazne bez relace (protoze
> >> to je pomerne novinka). Nejspis by to melo obsahovat ruzne hodnoty layer
> >> + building:levels/building:min_level ... (at uz v metrech nebo poctu
> >> pater) ale variabilita bude pomerne velka vzhledem k tomu, ze tenhle
> >> zpusob tagovani se neustale meni.
> >> 
> >> Jop, jinak byva zvykem zachovat spis starsi objekt v OSM.
> >> 
> >>> --
> >>> Petr
> >>> 
> >>> 
> >>> _______________________________________________
> >>> Talk-cz mailing list
> >>> Talk-cz na openstreetmap.org
> >>> https://lists.openstreetmap.org/listinfo/talk-cz
> >> 
> >> _______________________________________________
> >> Talk-cz mailing list
> >> Talk-cz na openstreetmap.org
> >> https://lists.openstreetmap.org/listinfo/talk-cz
> > 
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-cz
> 
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz




Další informace o konferenci talk-cz