Salut Eddy,<div><br></div><div>Am preluat ultima varianta a scriptului si de asemenea am adaugat in tool-ul de parsare regulile de sed mentionate <a href="http://wiki.openstreetmap.org/wiki/User:Xybot/FixRomanianDiacritics" target="_blank">aici</a> pentru ca diacriticile din fisierele sursa sunt de tip gresit (cel putin eu asa am inteles).</div>
<div><br></div><div>Atasez fisierul sursa (csv) si fisierul output (osm) pentru judetul Alba - pentru a obtine de la voi ultimele comentarii referitoare la acest import (tot am amanat importul pana cand Vasile ne da OK-ul pentru ultima versiune a surselor).</div>
<div><br></div><div>Referitor la codul postal am ales sa pun campul <span style="font-family:'courier new', monospace">old_postal_code</span> (la sugestia lui alex "alea alea") pentru ca grupul <span style="font-family:'courier new', monospace">addr:*</span> se refera la cladiri (cel putin eu asa am inteles), pentru cazul nostrul codul postal al unei localitati (asta importam) ar fi fost trecut in campul <span style="font-family:'courier new', monospace">postal_code</span></div>
<div><span style="font-family:'courier new';font-size:12px"><br></span></div><div><span style="font-size:12px"><span style="font-family:arial, helvetica, sans-serif">Referitor la suprascrierea datelor - am ales sa facem manual aceasta operatie tocmai pentru a nu pierde date vechi (nu m-am gandit la history - crezi ca e asa de importanta?). Vom trata fiecare caz in parte si vom tine cont de comentariile tale.</span></span></div>
<div><span style="font-size:12px"><br></span></div><div><span style="font-size:12px">Referitor la populatie - in fisierele sursa sunt incluse informatiile de la ultimul recensamant (2002). Daca tu ai avut alta surse te rog sa o mentionezi pentru a putea face medierea acestora.</span></div>
<div><br></div><div>Multumesc,</div><div>Nini.<br><br><div class="gmail_quote">2009/6/12 Eddy Petrișor <span dir="ltr"><<a href="mailto:eddy.petrisor@gmail.com" target="_blank">eddy.petrisor@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
indreias a scris:<br>
<div>> Salut Eddy,<br>
><br>
> Multumesc mult pentru script - l-am integrat in parser si totul pare<br>
> OK.<br>
> In urma testelor am adaugat si particula "Lui" la trecerea in<br>
> minuscule (ex. "Valea lui Mihai").<br>
<br>
</div>Cred că ar fi bine să adaugi și "Cel" - Alexandru cel Bun, Stefan cel Mare<br>
<div><br>
> $line =~ s/ (Lui|De|Din|Spre|La|Si|Pe|Și|Prin|Dinspre|Cu) / \l$1 /g;<br>
<br>
</div>Mă gândesc să adaug scriptul la un repo public. Eu am mai făcut câteva<br>
mici schimbări (după ce am mai citit un pic de documentație).<br>
<div><br>
> Astazi voi sterge datele introduse ieri (judetul Alba) si le voi re-<br>
> importa (in jurul orei 17:00). Sper ca Francisc sa aiba timp si sa<br>
> transmita mai multe detalii ref. la observatiile lui de ieri.<br>
><br>
> Ref. la mediul meu de lucru (ca o scuza pentru mentiunea mea despre<br>
> diacritice...) lucrez cu cygwin pe o statie Windows si sunt total<br>
> neobisnuit sa lucrez cu diacritice. Nu ma pot schimab si nici nu vreau<br>
> sa pornesc o noua discutie pe aceasta tema - atata timp cat sursa are<br>
> diacritice si cu ajutorul tau si al colegilor de aici reusim sa<br>
> pastram informatia este excelent.<br>
<br>
</div>Hmm, sunt tare curios dacă nu cumva în urma transformării ai ajuns sa ai<br>
chestii de genul:<br>
<br>
CâMpulung, PetreșTi, SăVâRșIn<br>
<br>
Adică nu cumva îți apare literă mare după oricare din diacritice?<br>
<br>
Dacă da, atunci ai nevoie de locale și probabil de noul script care are<br>
grijă să forțeze locala pe ro_RO.UTF-8 în script pentru a procesa corect<br>
datele.<br>
<br>
Noul script e atașat.<br>
<div><div></div><div><br>
--<br>
Regards,<br>
EddyP<br>
=============================================<br>
"Imagination is more important than knowledge" A.Einstein<br>
</div></div><br>_______________________________________________<br>
Talk-ro mailing list<br>
<a href="mailto:Talk-ro@openstreetmap.org" target="_blank">Talk-ro@openstreetmap.org</a><br>
<a href="http://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">http://lists.openstreetmap.org/listinfo/talk-ro</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br>Best regards,<br>Ioan (Nini) Indreias - <a href="mailto:indreias@gmail.com" target="_blank">indreias@gmail.com</a><br>
</div>