[Talk-ro] Import în masă a localităților (thread #2)
Eddy Petrișor
eddy.petrisor at gmail.com
Thu Jun 11 23:20:48 BST 2009
indreias a scris:
> Salut Vasile,
>
> Multumesc pentru informatiile transmise.
>
> Si eu sunt sigur ca localitatile existente nu contin date SIRUTA iar
Apropos de SIRUTA, am văzut că în unele locuri au fost adăugate
informaţiile SIRUTA direct cu chei de genul "TIP", "SIRUTA" etc.
As vrea să vă sugerez să adaugați informațiile ăstea într-un „namespace”
propriu și să se folosească chei de tipul:
siruta:siruta
siruta:tip
siruta:superior
siruta:denumire
siruta:judet
Pentru a nu încurca și a nu suprascrie eventualele date deja existente
cu cele din siruta si pentru a clarifica faptul că există o corelație
între informațiile cu pricina.
> duplicatele le vom detecta prin analiza de proximitate (cu metodele
> GIS din postgres) pentru puncte de tip localitate (place != ""), cu
> nume de lungime egala (pentru a abstractiza diacriticile si upper/
> lower case), cu distanta de maxim 2km intre ele (aici vom mai incerca
> si alte valori, in functie de rezultate). Lista generata o vom folosi
> intr-o procedura manuala pentru a analiza daca punctele existente au
> informatii utile (de ex. old_name, nume in alte limbi, etc),
> includerea acestora in descrierea noilor puncte si apoi stergerea
> punctelor vechi.
Am ceva obiecții la procedura asta:
1) nu sunt de acord să se ștergă nodurile vechi; acestea au un istoric
și se pot muta pe pozițiile noi; adăugarea unui nod total nou face sa se
piarda tot istoricul pierzându-se informații importante
2) nodurile actuale ar putea avea informații utile, trebuie să se facă o
uniune a datelor din nodul actual cu cele din import; de exemplu, eu am
adăugat în multe locuri populația localităților
3) NU SUPRASCRIEȚI INFORMAȚII EXISTENTE!!! chiar eu știu că am adăugat
codurile poștale noi pentru câteva localități din Olt, deci scriererea
codurilor poștale vechi ar șterge codurile actuale
> Cel mai mult imi pare rau ca datele de la voi contin codurile postale
> vechi - exista vreo sansa sa refaceti datele cu codurile noi?
aș sugera addr:old_postcode ca nume de cheie pentru acele coduri poștale
cu ștergerea lui addr:postcode dacă e identic cu cel din baza de date -
deoarece, evident e cel vechi, cel nou trebuie adăugat; prezența codului
poștal vechi în forma asta ajută la identificarea localităților/zonelor
în care codul nou lipsește.
> Oricum, probabil aceasta nu se va face peste noapte si includerea
> acestor date ar putea fi facuta ulterior - chiar daca ceva mai greu.
>
> Este OK includerea campului source=geo-spatial.org , sau consideri
> utila o alta nota?
sugerez "source:siruta=geo-spatial.org" pentru a nu suprascrie valorile
existente și pentru a clarifica care e obiectul lui "source"
--
Regards,
EddyP
=============================================
"Imagination is more important than knowledge" A.Einstein
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 197 bytes
Desc: OpenPGP digital signature
URL: <http://lists.openstreetmap.org/pipermail/talk-ro/attachments/20090612/565f7beb/attachment.pgp>
More information about the Talk-ro
mailing list