[Talk-lv] Rīgas adrešu punktu imports no opendata.riga.lv
Vitaly Bolshakov
v.bolshakovs at gmail.com
Tue May 5 09:51:07 UTC 2015
Sveiki, Latvijas OpenStreetMap kopiena!
Vēlētos uzsākt atklātu diskusiju par lielo Rīgas adrešu punktu importu no
opendata.riga.lv datiem.
Kā jūs varētu pamanīt, pēdējas divās nedēļās OSM kartē Rīgas robežās dažas
reizes parādījās un pazuda jaunie adrešu punkti. Tas bija divu nesekmīgu
adrešu importu rezultāts. Respektīvi:
http://www.openstreetmap.org/changeset/30315170 un
https://www.openstreetmap.org/changeset/30528590 . Abas izmaiņu kopas bija
neveiksmīgas dažu iemeslu dēļ un bija atsauktas (reverted).
Kā jūs zināt no talk-lv listes, nesen Rīgas pašvaldība atvēra dažus
pašvaldības datus un izlika tos zem ODC-By licenci
https://opendata.riga.lv/ tīmekļa portālā. Viena no interesantam datu
kopām ir Rīgas adrešu punkti - kas arī bija divas reizes nesekmīgi
importēti. Lai nākotnē nebūtu nekādu pārpratumu, pievadāju apspriest šo
importu.
* Dati
Pieejamā datu kopa ar Rīgas adrešu punktiem. Katram ierakstām ir noteiktas
LKS-92 ģeogrāfiskas koordinātes, ielas nosaukums un mājas numurs.
Principā, tā ir minimāla nepieciešama informācija adrešu punktiem OSM
datubāzē. Datu kopā ir ~37 tukst. adreses.
Daļēji tā pārklājas ar OSM jau esošām adresēm (~15 tukst. adreses), bet
~22 tukst. adreses (galvenokārt maz apsekotos rajonos) varētu būt
importētas OSM datu bāzē.
* Importa problēmas un to pievadātais risinājums
1) Lielais datu pārklājums (~15/37). Problēma bija noteikta pirmā
neveiksmīga importā. Dublējošie dati būtiski pasliktinās OSM datu
lietojamību un nav pieļaujami.
Lai to atrisinātu es izguvu visas OSM esošas Rīgas adreses (adrešu punktus
OSM punktiem, un adreses ēkām (building=*) OSM līnijām un relacijām). Pēc
tām, no opendata.riga.lv datu kopas bija izņemtas visas adreses, kas jau
ir OSM, un tika iegūta rezultējoša kopa ar ~22 tukst. adrešu punktiem, kas
vēl nav OSM, vai kuriem OSM adrese atšķiras no opendata.riga.lv.
2) Dažreiz ielas nosaukums opendata.riga.lv nesakrīt ar ielas nosaukumu
OSM. Visvairāk tas ir pamanīts visādām numurētām līnijām. Tā,
opendata.riga.lv līnijas ir rakstītas kā "Čiekurkalna 1.līnija", bet OSM
vēsturiski vai citu apsvērumu dēļ ir pieņemts rakstīt ar atstarpi pēc
punkta: "Čiekurkalna 1. līnija". Apstrādājot datus otrām importam tas tika
ņemts vērā un visas numurētas ielas bija attiecīgi konvertētas, lai būtu
atstarpe pēc punktā, kā tas ir pieņemts (?) Latvijas OSM kopienā.
2a) Pēc otrā neveiksmīga importa atklājas, ka dažviet OSM ielas nosaukumi
ir rakstīti ar kļūdu (galvenokārt gramatiskas kļūdas), bet tos būs
iespējams izmainīt pēc importa apskatot atklātos validatoros, kur jauniem
adrešu punktiem neatbilst esošie ielas nosaukumi. Pie reizes arī būs
redzams, kuras ielas nosaukumi nav OSM Rīgas kartē, un kur ir nepieciešama
apsekošana un ielu nosaukumu precizēšana.
3) Dažreiz OSM (arī mājas numura plāksnītes) adreses pieraksts varētu
atšķirties no opendata.riga.lv pierakstiem. Piemēram "70 k-6" un "70/6".
Tādu adrešu punktu ir pietiekami maz, bet tomēr ir. Kā atrisināt šo kļūdu
man pagaidām nav piedāvājumu. Tas arī ir datu divdabība, jo numura
plāksnīte atšķīrās no adrešu kataloga datiem, bet principā tam nav
jābūt... Pēc importa būs divi adrešu punkti, viens no apsekošanas, otrs no
kataloga.
4) Ja OSM kartē esošas adreses ir ar kļūdu. Iepriekš veikta datu atlase
neļaus izlabot šis kļūdas, jo adreses jau ir OSM, bet nepareizi izvietoti
ģeogrāfiski. Jaunie adrešu punkti ar tādām adresēm netiks importētas, un
vecas paliks savās vietās. Viena no manām idejām bija analizēt, cik tālu
adreses punkts ir no OSM objekta, bet tas būs pietiekami grūti realizējams
pie tik lielas datu kopas. Piedāvāju pieņemt, ka tādu objektu ir patiešam
ļoti maz, un tas nepasliktinās kopēju datu kvalitāti OSM datubāzē.
5) Kļūdas opendata.riga.lv datos. Apskatot datus, atrādu kā dažreiz arī
opendata.riga.lv ir kļūdas, kad mājas plāksnītes numurs nesakrīt ar
kataloga numuru. Šeit varētu būt divi kļūdu veidi.
5a) Uz ēkas ir veca numura plāksnīte, bet kataloga ir pareiza adrese: ir
vērts izveidot adreses punktu ar pareizu adresi.
5b) Ir kļūda opendata.riga.lv datos. Diemžēl tādas kļūdas nav iespējams
pamanīt un izlabot. Pieņemsim kā tādu kļūdu ir ļoti-ļoti maz, un tie
neietekmēs kopēju datu kvalitāti.
6) Importa pareiza dokumentēšana un apspriešana. Tā ir būtiska pašreizēja
problēma, kuru ir jāatrisina. Būs nepieciešama palīdzība no lietotājiem,
kas jau strādāja ar importu vadību. Būs nepieciešama palīdzība no Latvijas
OSM kopienas par importa kvalitātes uzlabošanu!
* Importa plusi un minusi
++ Būtiski tiks uzlabota kopēja adrešu situācija OSM Rīgā. Pašlaik adreses
ir atzīmētas galvenokārt tikai Rīgas centrā un blīvi apdzīvotās apkaimēs.
Ir atzīmētas mazāk nekā pusē no visam Rīgas adresēm (~15/37).
+ Būs atzīmētas adresēs slikti apsekotas Rīgas rajonos (galvenokārt
mazmāju privātsektorā). Būs piešķirtas adreses objektiem iezīmētiem no
satelīta attēla bez apsekošanas.
+ Adrešu reformas rezultātā vairākas OSM adreses ir novecojušas. Tiks
iezīmēti punkti ar jaunām adresēm.
+ Tiks atzīmēti objekti ar bojātiem vai pazaudētām adrešu plāksnēm.
- Adrešu punktu adrese var nesakrist ar OSM esošu vai apsekošanā iegūtu
adresi (sk. problēmu apspriešanu).
- Adrešu datu kopā opendata.riga.lv var būt kļūdas (sk. problēmu
apspriešanu).
- Adrešu datu kopā ir adrešu punkti visādiem maziem un industriāliem
objektiem, piemēram elektriskām būdām. Vai kopiena to atbalsta?
- Adrešu datu kopā ir adrešu punkti jau izdemolētiem objektiem. Importēts
adrešu punkts atbilsts neesošam objektam, piem.: tukšai pļavai, kur
iepriekš bija māja.
-- Importējamie datu punkti dažreiz atbilst zemēs vienībai, un adrešu
punktam neatbilst vispār neviens objekts dabā. Piem.: adrešu punkts
pagalmā starp daudzstāvu ēkām. Laikam privātzemei punktā koordinātēs
atbilst kāda adrese Rīgas pašvaldībā, bet dabā ir bērnu rotaļlaukums, vai
krūmi un koki.
- Importējami adrešu punkti dažreiz atbilst vēl neesošiem vai projektētiem
objektiem.
* Jautājumi diskusijai
Pirmais un galvenais jautājums: vai Latvijas OSM kopiena vispār piekrīt
importēt šis datus OSM bāzē?
Vai importa jautājums ir apspriežams vispār, un vai ir lielie iebildumi
vai atbalsts adrešu importa veikšanai?
Kādas vēl problēmas vārētu būt ar importu, no tiem kas vel nav apskatītas?
Kādi būtu OSM Latvijas kopienas lietotāju ieteikumi, padomi un
rekomendācijas importa uzlabošanai?
Būtu vēlams kopienas atbalsts un diskusija. Lielākais atbalsts kas būtu
nepieciešams pašlaik ir importa pareiza (un OpenStreetMap visas kopienas
atbilstoša) pārvaldība un dokumentācija no pieredzējušiem lietotājiem.
Ar cieņu, Vitālijs
More information about the Talk-lv
mailing list