[Talk-ro] Import în masă a localităților (thread #2)

Eddy Petrișor eddy.petrisor at gmail.com
Fri Jun 12 08:09:15 BST 2009


indreias a scris:
> Salut Eddy,
> 
> Multumesc mult pentru script - l-am integrat in parser si totul pare
> OK.
> In urma testelor am adaugat si particula "Lui" la trecerea in
> minuscule (ex. "Valea lui Mihai").

Cred că ar fi bine să adaugi și "Cel" - Alexandru cel Bun, Stefan cel Mare

> $line =~ s/ (Lui|De|Din|Spre|La|Si|Pe|Și|Prin|Dinspre|Cu) / \l$1 /g;

Mă gândesc să adaug scriptul la un repo public. Eu am mai făcut câteva
mici schimbări (după ce am mai citit un pic de documentație).

> Astazi voi sterge datele introduse ieri (judetul Alba) si le voi re-
> importa (in jurul orei 17:00). Sper ca Francisc sa aiba timp si sa
> transmita mai multe detalii ref. la observatiile lui de ieri.
> 
> Ref. la mediul meu de lucru (ca o scuza pentru mentiunea mea despre
> diacritice...) lucrez cu cygwin pe o statie Windows si sunt total
> neobisnuit sa lucrez cu diacritice. Nu ma pot schimab si nici nu vreau
> sa pornesc o noua discutie pe aceasta tema - atata timp cat sursa are
> diacritice si cu ajutorul tau si al colegilor de aici reusim sa
> pastram informatia este excelent.

Hmm, sunt tare curios dacă nu cumva în urma transformării ai ajuns sa ai
chestii de genul:

CâMpulung, PetreșTi, SăVâRșIn

Adică nu cumva îți apare literă mare după oricare din diacritice?

Dacă da, atunci ai nevoie de locale și probabil de noul script care are
grijă să forțeze locala pe ro_RO.UTF-8 în script pentru a procesa corect
datele.

Noul script e atașat.

-- 
Regards,
EddyP
=============================================
"Imagination is more important than knowledge" A.Einstein
-------------- next part --------------
A non-text attachment was scrubbed...
Name: correct_case.pl
Type: text/x-perl
Size: 491 bytes
Desc: not available
URL: <http://lists.openstreetmap.org/pipermail/talk-ro/attachments/20090612/5f4b8b63/attachment.pl>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 197 bytes
Desc: OpenPGP digital signature
URL: <http://lists.openstreetmap.org/pipermail/talk-ro/attachments/20090612/5f4b8b63/attachment.pgp>


More information about the Talk-ro mailing list