[Talk-ro] Import în masă a localităților (thread #2)
Vasile Craciunescu
vasile.craciunescu at gmail.com
Thu Jun 11 11:59:20 BST 2009
Salutare,
La construcția setului de date cu localități ne-am folosit de
informațiile publicate pe siteul Institutului Național de Statistică, la
secțiunea nomenclatoare statistice SIRUTA (<http://tinyurl.com/lvy2ud>).
În felul asta ne-am asigurat că: (1) am inclus toate localitățile
recunoscute oficial, la nivelul anului 2008, în România; (2) avem ca
atribut pentru fiecare localitate un cod unic de identificare (codul
SIRUTA); (3) pentru fiecare localitate avem denumirea recunoscută
oficial de statul român. Actualizările viitoare se vor face ținînd cont
de aceleași nomenclator.
Vă recomand călduros să folosiți codul unic SIRUTA atunci cînd faceți
operații de filtrare a duplicatelor. Filtrarea pe bază de nume este
inexactă și necesită intervenții manuale. N-am verificat în ce măsură
localitățile existente în OSM conțin acest cod. Din punctul meu de
vedere se pot înlocui complet localitățile existente in OSM cu cele de
pe geo-spatial.org. Vă pot asigura că s-a lucrat foarte meticulos. De
exemplu, am petrecut ore bune încercînd să identificăm localități
desființate înainte de 1989 și reînființate ulterior. De cele mai multe
ori am apelat la seturi de hărți vechi, cum sînt cele de la
<http://earth.unibuc.ro/download/harile-austriece-1910-reproiectate-in-stereo70>.
Pînă luni vom publica un update ce vizează coordonatele localităților
din 33 de județe (cele cuprinse între Buzău și Giurgiu).
Printre cîmpurile provenite din nomenclatorl SIRUTA se găsește unul
numit "RANG". Este vorba de o clasificare oficială a localităților din
România. Corespondența numerelor din tabel o găsiți la
<http://preview.tinyurl.com/lcotue>. Mă gîndesc că poate fi de folos la
stabilirea corespondenței cu clasificarile din OSM.
Toate bune,
Vasile
indreias wrote:
> Am inceput importul cu judetul Alba - http://www.openstreetmap.org/browse/changeset/1478008
> Importul s-a facut prin JOSM, durata de upload pentru datele din Alba
> (aprox. 700 de localitati) fiind de maxim 2 minute.
>
> Decizia de impartire sat/catun am facut-o pe baza numarului de
> locuitori (sub 50 de locuitori am schimbat village cu hamlet).
>
> Observatii:
> 1. Numele localitatilor este capitalizat, asa fiind prezent in
> fisierul sursa de pe geo-spatial. A fost greu sa fac o regula de
> transformare in caractere de tip lowercase pe urmatoarele motive:
> a. diacritice (characterset: UTF-8)
> b. probleme de tipul: "Timisul De Jos/Timisul de Jos/Timisul de jos"?
> etc.
>
> 2. In fisierul sursa codul postal este cel vechi si a fost introdus cu
> tag-ul old_postal_code.
>
> 3. Avem planificat un utilitar care va identifica dublurile
> (localitatile deja definite), urmand sa-l rulam in timp iar corectia
> sa fie facuta manual, pentru a nu se pierde informatia introdusa deja.
>
> Daca feedback-ul vostru este pozitiv, voi continua upload-ul cu cate
> un oras pe zi, incepand cu saptamana viitoare.
>
> Toate bune,
> Nini
>
> _______________________________________________
> Talk-ro mailing list
> Talk-ro at openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-ro
>
More information about the Talk-ro
mailing list