[Talk-ro] Import în masă a localităților (thread #2)

Vasile Craciunescu vasile.craciunescu at gmail.com
Thu Jun 11 11:59:20 BST 2009


Salutare,

La construcția setului de date cu localități ne-am folosit de 
informațiile publicate pe siteul Institutului Național de Statistică, la 
secțiunea nomenclatoare statistice SIRUTA (<http://tinyurl.com/lvy2ud>). 
În felul asta ne-am asigurat că: (1) am inclus toate localitățile 
recunoscute oficial, la nivelul anului 2008, în România; (2) avem ca 
atribut pentru fiecare localitate un cod unic de identificare (codul 
SIRUTA); (3) pentru fiecare localitate avem denumirea recunoscută 
oficial de statul român. Actualizările viitoare se vor face ținînd cont 
de aceleași nomenclator.

Vă recomand călduros să folosiți codul unic SIRUTA atunci cînd faceți 
operații de filtrare a duplicatelor. Filtrarea pe bază de nume este 
inexactă și necesită intervenții manuale. N-am verificat în ce măsură 
localitățile existente în OSM conțin acest cod. Din punctul meu de 
vedere se pot înlocui complet localitățile existente in OSM cu cele de 
pe geo-spatial.org. Vă pot asigura că s-a lucrat foarte meticulos. De 
exemplu, am petrecut ore bune încercînd să identificăm localități 
desființate înainte de 1989 și reînființate ulterior. De cele mai multe 
  ori am apelat la seturi de hărți vechi, cum sînt cele de la 
<http://earth.unibuc.ro/download/harile-austriece-1910-reproiectate-in-stereo70>. 
  Pînă luni vom publica un update ce vizează coordonatele localităților 
din 33 de județe (cele cuprinse între Buzău și Giurgiu).

Printre cîmpurile provenite din nomenclatorl SIRUTA se găsește unul 
numit "RANG". Este vorba de o clasificare oficială a localităților din 
România. Corespondența numerelor din tabel o găsiți la 
<http://preview.tinyurl.com/lcotue>. Mă gîndesc că poate fi de folos la 
stabilirea corespondenței cu clasificarile din OSM.

Toate bune,
Vasile

indreias wrote:
> Am inceput importul cu judetul Alba - http://www.openstreetmap.org/browse/changeset/1478008
> Importul s-a facut prin JOSM, durata de upload pentru datele din Alba
> (aprox. 700 de localitati) fiind de maxim 2 minute.
> 
> Decizia de impartire sat/catun am facut-o pe baza numarului de
> locuitori (sub 50 de locuitori am schimbat village cu hamlet).
> 
> Observatii:
> 1. Numele localitatilor este capitalizat, asa fiind prezent in
> fisierul sursa de pe geo-spatial. A fost greu sa fac o regula de
> transformare in caractere de tip lowercase pe urmatoarele motive:
> a. diacritice (characterset: UTF-8)
> b. probleme de tipul: "Timisul De Jos/Timisul de Jos/Timisul de jos"?
> etc.
> 
> 2. In fisierul sursa codul postal este cel vechi si a fost introdus cu
> tag-ul old_postal_code.
> 
> 3. Avem planificat un utilitar care va identifica dublurile
> (localitatile deja definite), urmand sa-l rulam in timp iar corectia
> sa fie facuta manual, pentru a nu se pierde informatia introdusa deja.
> 
> Daca feedback-ul vostru este pozitiv, voi continua upload-ul cu cate
> un oras pe zi, incepand cu saptamana viitoare.
> 
> Toate bune,
> Nini
> 
> _______________________________________________
> Talk-ro mailing list
> Talk-ro at openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-ro
> 





More information about the Talk-ro mailing list