[Talk-cz] Ruian jako zdroj dat

Mirek Dlask dlask.m na gmail.com
Středa Listopad 27 18:24:05 UTC 2013


Zdravím všechny

Když tady někdo před vice jak rokem zmínil, že bude trvat zhruba rok, než
dojde k nějakému použití dat z Ruian  nevěřil jsem. Bohužel je to ještě
horší. Pokud vím proběhlo snad jen zpřesnění hranic regionů a to je vše ?!
Lze nalézt pár dalších jednorázových pokusů. Čekání na nějaké globální
řešení jsem se krátil po svém. Pokud se na mě někdo obrátil nabídnul jsem
mu pomoc. Nikdo toho nevyužil. Možná čekali nějaké snadné řešení. Ale já
nic takového nemám a nenabízím. Kdo chtěl data dostal je. Kdo chtěl zdroják
poslal jsem mu jej.

Zkoušel jsem nejen adresní místa, ale i stavební objekty (SO). Bohužel data
v Ruian jsou prošpikovány mnoha chybami.
Konkrétně u SO

- neúplná geometrie Např. výrazný lichoběžník u SO na dvou lichoběžníkových
parcelách, vícevchodové SO neúplné délky, na hranicích digitalizovaného
území.
- jeden SO rozčleněný do několika multipolygonů - čekal bych SO pro jeden
účel, s jedním majitelem = jeden multipolygon
- naopak více SO v jednom multipolygonu. Např. rodinný dům a samostatně
stojící garáž
- jako SO jsou označeny a evidovány dvorky, zastavěné plochy, zahrady, ale
i celé parcely
- za chybu nelze považovat množství pro OSM zbytečných bodů
Patrně největší zastřešený bufet v Českém ráji
http://maps.fordfrog.com/?zoom=19&lat=50.49404&lon=15.14469&layers=B00FFF
-  přiznám se, že mi je záhadou neúplnost dat. Jedna stodola zakreslená,
sousedovic o pár metrů dál už ne. Nejsou zde i velmi významné ( výrazné
budovy) Např ve Škoda Auto je zakreslena jen část hal, zato je s
neuvěřitelnou přesností zakreslen  oválný zkušební polygon.
http://maps.fordfrog.com/?zoom=17&lat=50.42189&lon=14.92084&layers=B00FFF
(zhruba
uprostřed)
 - SO v SO. Dopručuji Kolín...
http://maps.fordfrog.com/?zoom=18&lat=50.01861&lon=15.22189&layers=B00FFF


Chyby u adresních míst (AM)
-  AM vzdálená desítky i stovky metrů  od mateřského SO.
- AM na hospodářských budovách. Pokus o nahlášení chyby skončil sice
doplněním chybějícího SO, ale AM je i nadále na chlívku.
- mnoho AM bez geometrie (  geometrie lze získat ze SO)
- konflikty AM - na jednom SO více AM často ve stylu ev.5 + čp.5, oblast se
dvěma řadami AM ze dvou částí obce

Všechno odhalit a vyeliminovat není snadné.
Pokud bude v budoucnu probíhat import dat polo/automaticky bude stav ještě
horší. Je a bude nutný ruční zásah. Jestli ruční korekce nějak značit
nechám na zkušenějších.
Nedokážu rozhodnout zda je přesnější Ruian nebo KM. Geometrie SO vychází z
KM, umístění AM je rozdílné. V KM v mnoha případech odpovídá definičnímu
bodu SO.

Kromě geometrie SO je k dispozici i jejich účel (využití). Příslušný
číselník jsem nenašel (moc jsem nehledal), ale vypadá zhruba takto

1;průmyslový objekt
2;zemědělská usedlost
3;objekt k bydlení
4;objekt lesního hospodářství
5;objekt občanské vybavenosti
6;bytový dům
7;rodinný dům
8;stavba pro rodinnou rekreaci
9;stavba pro shromažďování většího počtu osob
10;stavba pro obchod
11;stavba ubytovacího zařízení
12;stavba pro výrobu a skladování
13;zemědělská stavba
14;stavba pro administrativu
15;stavba občanského vybavení
16;stavba technického vybavení
17;stavba pro dopravu
18;garáž
19;jiná stavba
20;víceúčelová stavba
21;skleník
23;hráz přehrazující vodní tok nebo údolí
24;hráz k ochraně nemovitostí před zaplavením při povodni
25;hráz ohrazující umělou vodní nádrž
28;stavba k využití vodní energie (vodní elektrárna)

Jsou (budou) k dispozici další technické specifikace, prozatím jen u nových
SO. Podrobnosti lze nalézt i na stránkách Ruian u každého SO. Využitelnost
v OSM je otázkou...

Konečnou fází importu je vizuální kontrola dat,  validace a nahrání pomocí
JOSM.
Opakuji - žádné snadné řešení nemám.
Hlavní zbraně současných partyzánů jsou:
Ubuntu 13.04, wget, ruian2pgsql, postgres, postgis, pgadminIII a několik
nesourodých javovských bastlů, kterými páruji data a vytvářím výstupy.
Výstup do konzole přesměrovávám do souboru. To hlavní je spousta času při
prověřování aktuálnosti nespárovaných dat v OSM. Samotná manipulace zabere
jen zlomek času.
Základním územím na kterém pracuji je okres.
Princip je jednoduchý.
stáhnu data z OSM pomocí JOSM
stáhnu data z Ruian pomocí wget
pomocí ruian2pgsql dostanu data do databáze
jednoduchým java bastlem dostanu OSM data do databáze
mám vytvořené dvě tabulky a snažím se postupně data párovat. Od dokonalé
shody (není třeba aktualizovat) přes spárovaná data (aktualizovat) přes
není v Ruian ani KM, ale ničemu nepřekáží (beze změn) až po duplicity,
konflikty s novými AM (odstraňuji)
kontroluji vzdálenost od SO (má-li geometrii) případně koriguji
kontroluji validuji a odesílám pomocí JOSM

Z OSM dat je zřejmé, že v minulosti proběhly dvě zásadní importní období.

Jedno je popsáno zde http://wiki.openstreetmap.org/wiki/Import_Adres_%C4%8CR

Kvalita velmi rozdílná v závislosti na tom jak kdo ne/pochopil rozdělení
obcí na jednotlivé části. Pokud se mi sejde na náměstí pět čp. 1 je zřejmé
že je někde chyba.
(stovky chyb). V horším případě ještě s poznámkou o duplicitě nebo o
nekonzistenci ...   Zde je nedostižným "vítězem" Liberec. Aktualizace místy
velmi pracná.

Druhým importem jsou data označená uir_adr:ADRESA_KOD. Pro ta jsou
charakteristické. Neúplné tagování a polohová nepřesnost, ale i otazníky v
addr:housenumber
Aktualizace bez problémů - uir_adr:ADRESA_KOD je totožný jako kod AM v
rn_adresni_misto

Oba importy nesprávně rozlišují velikost písmen (U Studánky vs. U studánky.
Navíc se místy vzájemně překrývaly (překrývají?) a vytvářely duplicity (MB,
ME, Říčany ....)

Nemohu nevzpomenout individuální obkreslování KM. Kvalita různá. Od name
27/1 až po takřka dokonalou práci... Aktualizace místy opravdu nemožná
(zbytečná).

Budoucnost nepatří aluminiu, ale Ruian. Pokud bude zájem, jsem k dispozici.
Samozřejmě ideální by byla skupina programátorů .. Osobně jsem doufal, že
se někdo přidá k fordfrogovi (on možná taky). Na druhou stranu nevím zda
bych jako programátor relaxoval programováním.
Možná by se hodil nějaký školní projekt ... ale na zázraky jsem nikdy
nevěřil.

M.D.




Dne 27. listopadu 2013 10:09 Dalibor Jelínek <dalibor na dalibor.cz> napsal(a):

> Cau,
>
> koukal jsem na to zbezne. Stahlo mi to 300MB dat je v bodech, coz vypada,
> ze partyzanujes, uz celkem dlouho. ;-)
>
> Celkem se mi to zatim libi.
>
>
>
> Treba jsem hodne rad, ze pouzivas addr:place, tak kde nejsou ulice, takze
> to pak pujde najit.
>
>
>
> Vypada to, ze ovsem nedelas jen adresni body, ale i budovy.
>
> Jako trochu neprijemne, ale asi nevyhnutelne vidim, ze kdyz takhle
> naimportujes vesnici,
>
> tak tam si tretina domu chybi, takze je ji stejne potreba dodelat rucne.
>
> Predpokladam, ze v RUIANu jsou jen budovy postavene dle nejakeho
> stavebniho rizeni
>
> a ze mensi stavby, ktere asi neprochazi tolik a urednim simlem tam nejsou.
>
> Je to tak?
>
>
>
> Ovsem nekdy to dela nehezke vezi, jako tady id=244571117, kdy ten dum je
> tam
>
> jen castecne. Da se tomu nejak vyhnout?
>
>
>
> Predpokladam, ze ten import je poloautomaticky, ze kontrolujes, jestli tam
> uz neco nenakreslil nekdo drive.
>
> Je to tak?
>
>
>
> Na jiny problemek jsem narazil v nejake vesnici, kam si asi adresy uz dal
> drive.
>
> Byly tam nejake adresni body, ktere jsou podle RUIAN jinde, nez mi ukazuje
> KM.
>
> Co ma pak vice pravdu? V tomhle pripade se mi zdalo, ze logictejsi misto
> je to, ktere
>
> ukazovala KM, ale nevim, proc k tomu rozdilu dochazi a jaka data jsou
> lepsi.
>
>
>
> A kdyz uz ti s tim adresnim bodem pohnu, tak ti mam zachovat ref:ruian
>
> a prepsat source:addr z "ruian" na "cuzk:km"? Nebo to mam nechat a pripsat
>
> treba addr:loc=cuzk:km?
>
>
>
> Proc nekde jsou tvoje adresy o chloupek mimo nez body v KM?
>
> Treba id=2517820160
>
>
>
> Jsi schopen a ochoten poskytnout svuj importovaci software i jinym, aby ho
> mohli pouzivat?
>
>
>
> Je v RUIAN k dispozici vice informaci treba k budovam, ktere bychom mohli
> nejak vyuzit?
>
> Nebo ten obrys je vse, co se da vytahnout?
>
>
>
> Zdravi,
>
>  Dalibor
>
>
>
>
>
> *From:* Mirek Dlask [mailto:dlask.m na gmail.com]
> *Sent:* Tuesday, November 26, 2013 10:28 PM
> *To:* OpenStreetMap Czech Republic
> *Subject:* Re: [Talk-cz] Ruian jako zdroj dat
>
>
>
> 1) import adresních bodů
>
> 2) Minimalis_import
>
> 3-4) vycházel jsem z předchozích diskuzí zde a částečně ze zvyklostí
> vyčtených v OSM datech.
>
> Pochopil jsem, že hledat řešení akceptovatelné všemi je zbytečná ztráta
> času. Takže možná tak trochu partyzánština.
>
>
>
> M.D.
>
>
>
>
>
> Dne 26. listopadu 2013 22:19 hanoj <ehanoj na gmail.com> napsal(a):
>
> Ahoj,
>
> možná by neškodilo dodat:
> 1) co jsi dělal
> 2) pod jakým účtem
> 3) kde je k tomu popis postupu a metadata k výsledku
> 4) kdy jsi to výše uvedené předhodil talk-cz k připomínkám
>
> díky hanoj
>
>
> Dne 26. listopadu 2013 22:04 Mirek Dlask <dlask.m na gmail.com> napsal(a):
> > Ahoj komunito
> >
> >  Jak už jsem psal nedávno, byl jsem na svoji záškodnickou činnost (
> import
> > dat Ruian z uživatelského účtu)  upozorněn P Normanem. Po založení
> > dedikovaného účtu a pár importech jsem byl bloknut s následujícím
> > vysvětlením.
> >
> > would you please, before continuing any of your imports, e-mail
> > data na osmfoundation.org and explain how you have conformed to our import
> > guidelines (see http://wiki.openstreetmap.org/wiki/Import)? I couldn't
> find
> > any discussion about your proposed import on the imports@ list and the
> > source of your data is unclear.
> >
> > Frederik Ramm
> > OSMF Data Working Group
> >
> > Vzhledem k mojí neochotě se někam registrovat a ještě menšímu
> diplomatickému
> > umění něco vysvětlovat bych tuto ne/milou povinnost přenechal někomu
> jinému.
> > Třeba už je někdo registrován a jeho angličtina je lepší než ta moje. Ani
> > nevím co a jak vysvětlovat e-mailem.
> > Hlásí se někdo dobrovolně?
> >
> > M.D.
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20131127/713b568c/attachment.html>


Další informace o konferenci talk-cz