[Talk-ro] Import în masă a localităților (automat)
Eddy Petrișor
eddy.petrisor at gmail.com
Fri Jul 10 23:14:44 BST 2009
Ioan Indreias a scris:
> Eddy Petrișor a scris:
> - Show quoted text -
> Codul e public acum:
>
> http://repo.or.cz/w/osm-ro-tools.git
>
>
>
> Salut Eddy,
>
> Am vazut ca ai mai lucrat la proiectul de import.
>
> Pentru a fi sigur ca nu exista diferente intre structura datelor
> importate pana acum si ce se va face cu utilitarul dezvoltat de tine
> redau mai jos un extras din judetul Alba:
>
> <node id='-5' visible='true' lat='46.020333036671254'
> lon='23.594298234285848'>
> <tag k='name' v='Oarda'/>
> <tag k='siruta:code' v='1053'/>
> <tag k='siruta:code_sup' v='1017'/>
> <tag k='siruta:type' v='10'/>
> <tag k='siruta:county' v='Alba'/>
> <tag k='siruta:county_code' v='AB'/>
> <tag k='siruta:county_id' v='1'/>
> <tag k='old_postal_code' v='2515'/>
> <tag k='is_in' v='Alba Iulia,Alba,România'/>
> <tag k='population' v='1830'/>
> <tag k='place' v='village'/>
> <tag k='source' v='geo-spatial.org <http://geo-spatial.org>'/>
>
> si un extras din sirutacsv.py
> <http://repo.or.cz/w/osm-ro-tools.git?a=blob;f=sirutacsv.py;h=627cf62cd4b11bc951c85362de47b289aae48222;hb=e6ebef69436f73e25c3e7318b420b0b8e171bfdf>
>
> namemap = { 'X':'lon', \
> 'Y':'lat', \
> 'NAME':'name', \
> 'SIRUTA':'siruta:code', \
> 'OLD_POSTAL':'old_postal_code', \
> 'RANG':'siruta:rank', \
> 'TIP':'siruta:type', \
> 'SIRUTA_SUP':'siruta:code_sup', \
> 'NAME_SUP':'siruta:name_sup', \
> 'COUNTY':'siruta:county', \
> 'COUNTY_ID':'siruta:county_id', \
> 'COUNTY_MN':'siruta:county_code', \
> 'POP2002':'population2002', \
> 'REGION':'region', \
> 'REGION_ID':'siruta:region_id', \
> 'ENVIRO_TYP':'siruta:enviro_type', \
> 'SORT_CODE':'siruta:sortcode' }
>
>
> Observatiile mele sunt urmatoarele:
>
> 1. population versus population2002 - as inclina spre population,
> population2002 nefiind (cred) un tag standard. Eventual un
> population:year_of_census=2002 - sau ceva similar?
vezi mai jos.
> 2. subtag-urile rank,region, region_id, enviro_type si sortcode eu le-am
> considerat inutile
Nu intenționez să introduc toate câmpurile, dar pentru a avea un cod
care e corect dpdv semantic, trebuia să am o mapare (mai ales că
capetele de rând erau scrise cu majuscule).
> 3. inteleg ca tag-urile is_in, place si source le adaugi ulterior, cele
> de mai sus fiind doar o mapare intre campurile datelor de intrare si
> corespondentul OSM - corect?
Da, corect.
Ideea era ca prin mapare să ajung cât mai aproape de ce apare direct în
OSM, urmând ca pentru multe din câmpuri să fac o verificare. De exemplu,
pentru population2002, mă gândeam la ceva de genul:
dacă există population deja, atunci population2002 ar putea deveni
„population:census_2002".
Încă nu mi-e clar dacă ar trebui ca is_in să fie de forma „AB;RO” sau de
forma „Alba;România”.
> Sper sa nu te superi ca fac aceasta interventie, ideea fiind de a ne
> asigura ca suntem pe calea cea buna.
Nu, chiar deloc, și scuze că mă tot târâi cu implementarea.
Legat de idea importului am trimis un mail pe -dev să întreb dacă
utilizarea în stilul în care intenționez/inteționam eu, cu cereri pentru
fiecare localitate în parte, mi-ar putea atrage o interdicție de acces
la API:
http://lists.openstreetmap.org/pipermail/dev/2009-July/016102.html
Răspunsul lui Ævar m-a făcut să mă gândesc mai bine dacă nu cumva ar fi
o idee mai bună să am o instanță locală de postgres cu datele importate
via osmosis pentru a evita „ciocănirea” bazei de date în mod excesiv.
Oricum ar fi, am să continui lucrul mâine și duminică.
--
Regards,
EddyP
=============================================
"Imagination is more important than knowledge" A.Einstein
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 197 bytes
Desc: OpenPGP digital signature
URL: <http://lists.openstreetmap.org/pipermail/talk-ro/attachments/20090711/015a4e4f/attachment.pgp>
More information about the Talk-ro
mailing list