<div dir="ltr"><div><div><div>Salut,<br><br></div>cand se face reprocesarea? am inteles ca o data pe saptamana dar cand?<br></div>am notat linkul si am inceput cu E1, ca alea sunt simplu de gasit/corectat :)<br></div>Ciprian<br>

</div><div class="gmail_extra"><br><br><div class="gmail_quote">2013/11/19 Strainu <span dir="ltr"><<a href="mailto:strainu10@gmail.com" target="_blank">strainu10@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Salut,<br>
<br>
Fiecare din liniile tabelului ăluia reprezintă o eroare. Nu toate sunt<br>
erori în datele OSM, dar marea majoritate sunt. Trebuie deci<br>
corectate, cel mai probabil manual, deoarece în multe situații trebuie<br>
folosit bunul simț pentru a determina ce trebuie făcut.<br>
<br>
De exemplu, dacă scrie acolo că nu a putut fi identificat orașul,<br>
strada sau numărul în datele OSM, ar fi bine să fie adăugate<br>
(bineînțeles, dacă se potrivește - probabil că Peștera Polovragi<br>
<a href="http://www.openstreetmap.org/browse/node/304736181" target="_blank">http://www.openstreetmap.org/browse/node/304736181</a> nu are un număr,<br>
deși apare în pagină ca având număr lipsă, deci nu trebuie făcut<br>
nimic).<br>
<br>
Dacă nu se potrivește orașul sau strada între OSM și datele de la<br>
poștă, trebuie văzut care e forma corectă (inclusiv diacritice) și<br>
pusă în OSM. Aici sunt probabil multe erori și în datele de la poștă,<br>
de asta ziceam de folosirea bunului simț.<br>
<br>
În fine, o ultimă categorie de erori e când nu corespunde numărul de<br>
la OSM cu cel de la poștă sau codul poștal are un format greșit. În<br>
cazul ăsta trebuie aproape sigur cunoscută zona, pentru a ști exact ce<br>
număr e acolo și a putea determina codul poștal.<br>
<br>
Într-un mail anterior dădusem câteva exemple de corecturi făcute de mine:<br>
<br>
E1: <a href="http://www.openstreetmap.org/browse/changeset/18875399" target="_blank">http://www.openstreetmap.org/browse/changeset/18875399</a><br>
E2, W3: <a href="http://www.openstreetmap.org/browse/changeset/18875478
W4" target="_blank">http://www.openstreetmap.org/browse/changeset/18875478<br>
W4</a>: <a href="http://www.openstreetmap.org/browse/changeset/18875518" target="_blank">http://www.openstreetmap.org/browse/changeset/18875518</a> (aici era<br>
numărul trecut la cod)<br>
E4: <a href="http://www.openstreetmap.org/browse/node/1109599781" target="_blank">http://www.openstreetmap.org/browse/node/1109599781</a><br>
<br>
Puteți să le analizați și să vedeți cum am corectat problemele. Dacă<br>
formatul paginii vi se pare confuz, puteți veni cu sugestii de<br>
schimbare și îl adaptăm.<br>
<br>
Sper că acum e un pic mai clar ce trebuie făcut cu intrările din<br>
pagina asta. Dacă mai aveți întrebări, puneți-le.<br>
<br>
Strainu<br>
<br>
<br>
În data de 19 noiembrie 2013, 09:33, Razvan<br>
<<a href="mailto:radulescu.razvan@gmail.com">radulescu.razvan@gmail.com</a>> a scris:<br>
> Un pic de feedback ti-am da, dar sincer unii dintre noi nu prea se pricep<br>
> sau nu au inteles prea bine exact cum vrei sa faci toata treaba asta.<br>
> Probabil ca au mai citit mailul acesta si altii dar nu au venit cu un<br>
> raspuns din varii motive, dar cel mai probabil ca nu stiu cum sa te ajute.<br>
> Un rezumat pe scurt daca nu te superi cu ce ar trebui sa facem ar fi bine<br>
> venit si poate ca se vor "baga " mai multi.<br>
><br>
><br>
> On 19.11.2013 02:07, Strainu wrote:<br>
>><br>
>> OK, am încărcat o versiune care parcurge toate codurile poștale. Din<br>
>> păcate este enormă, aproape 1MB ca sursă, dar asta este. L-am setat să<br>
>> se actualizeze o dată pe săptămână. Dacă găsiți erori false, vă rog<br>
>> să-mi spuneți.<br>
>><br>
>> Pasul următor este să gândesc aplicația pentru adăugat coduri poștale.<br>
>> Voi veni cu un nou RFC pentru asta cât de curând. Un pic mai mult<br>
>> feedback m-ar ajuta :)<br>
>><br>
>> Multumesc,<br>
>>     Strainu<br>
>><br>
>> În data de 17 noiembrie 2013, 23:22, Strainu <<a href="mailto:strainu10@gmail.com">strainu10@gmail.com</a>> a<br>
>> scris:<br>
>>><br>
>>> Am terminat de verificat Bucureștiul. Am observat că o parte din erori<br>
>>> sunt în datele de la poștă, deci nu le luați de bune - verificați<br>
>>> numele străzilor la primărie sau alte părți.<br>
>>><br>
>>> Câteva observații despre numere: sunt prezentate sub forma [2, 4, 6] -<br>
>>> adică o listă de numere (echivalentul lui 2-6). Dacă lista e lungă de 100<br>
>>> de elemente, înseamnă că în datele de la poștă codul e până la<br>
>>> sfârșitul străzii (e.g. 2-T). Pentru ca scriptul să nu dea eroare,<br>
>>> trebuie<br>
>>> ca fiecare din numerele de pe OSM să fie în lista de la poștă.<br>
>>> E interesant că în unele cazuri nu se întâmplă asta<br>
>>> complet - de exemplu în cazul hotelului Radisson Blu. Astea sunt însă<br>
>>> situații rare, în general sunt trecute codurile corespunzătoare părții<br>
>>> celeilalte a străzii.<br>
>>><br>
>>> Mâine trec la restul României.<br>
>>><br>
>>> Strainu<br>
>>><br>
>>><br>
>>> În data de 15 noiembrie 2013, 14:06, Strainu <<a href="mailto:strainu10@gmail.com">strainu10@gmail.com</a>> a<br>
>>> scris:<br>
>>>><br>
>>>> Când o să termin de scris codul o să încerc și să-l fac să ruleze<br>
>>>> constant. Până atunci, e updatată când am ceva nou implementat.<br>
>>>><br>
>>>> Strainu<br>
>>>><br>
>>>> În data de 15 noiembrie 2013, 12:44, Filip Chirita Rares Cristian<br>
>>>> <<a href="mailto:chirita.rares@gmail.com">chirita.rares@gmail.com</a>> a scris:<br>
>>>>><br>
>>>>> Lista e updatata constant? Momentan m-am uitat la<br>
>>>>> <a href="http://www.openstreetmap.org/browse/way/245844791" target="_blank">http://www.openstreetmap.org/browse/way/245844791</a> care are deja<br>
>>>>> addr:city<br>
>>>>> pus. Daca nu e updatata constant, nu inseamna ca eventual o sa devina<br>
>>>>> foarte<br>
>>>>> confuz care sunt gata si care nu?<br>
>>>>><br>
>>>>> Rares<br>
>>>>><br>
>>>>><br>
>>>>> 2013/11/13 Strainu <<a href="mailto:strainu10@gmail.com">strainu10@gmail.com</a>><br>
>>>>>><br>
>>>>>> În data de 13 noiembrie 2013, 02:12, Filip Chirita Rares Cristian<br>
>>>>>> <<a href="mailto:chirita.rares@gmail.com">chirita.rares@gmail.com</a>> a scris:<br>
>>>>>>><br>
>>>>>>> Salut,<br>
>>>>>>><br>
>>>>>>> Pot sa te rog sa ne dai si un exemplu de corectat? Poate mintea mea<br>
>>>>>>> nu<br>
>>>>>>> merge<br>
>>>>>>> calumea momentan, dar nu imi dau seama de unde sa incep. Sa zicem<br>
>>>>>>> pentru<br>
>>>>>>> nodul asta: <a href="http://www.openstreetmap.org/browse/node/769289252" target="_blank">http://www.openstreetmap.org/browse/node/769289252</a> ce pot<br>
>>>>>>> sa<br>
>>>>>>> fac? Sa ma duc si sa pun addr:in_city = oras?<br>
>>>>>>><br>
>>>>>>> Rares<br>
>>>>>><br>
>>>>>> Mai trimisesem un mail de dimineață, dar s-a pierdut. Da, în principiu<br>
>>>>>> trebuie adăugate datele lipsă, is_in:city sau addr:city. Uite câte un<br>
>>>>>> exemplu pentru fiecare tip de eroare:<br>
>>>>>><br>
>>>>>> E1: <a href="http://www.openstreetmap.org/browse/changeset/18875399" target="_blank">http://www.openstreetmap.org/browse/changeset/18875399</a><br>
>>>>>> E2, W3: <a href="http://www.openstreetmap.org/browse/changeset/18875478" target="_blank">http://www.openstreetmap.org/browse/changeset/18875478</a><br>
>>>>>> W4: <a href="http://www.openstreetmap.org/browse/changeset/18875518" target="_blank">http://www.openstreetmap.org/browse/changeset/18875518</a> (aici era<br>
>>>>>> numărul trecut la cod)<br>
>>>>>> E4: <a href="http://www.openstreetmap.org/browse/node/1109599781" target="_blank">http://www.openstreetmap.org/browse/node/1109599781</a><br>
>>>>>><br>
>>>>>> Sunt și unele pentru care nu se poate/nu e evident să corectezi, de<br>
>>>>>> exemplu: <a href="http://openstreetmap.org/browse/node/610916914" target="_blank">http://openstreetmap.org/browse/node/610916914</a> Trebuie<br>
>>>>>> analizat de la caz la caz.<br>
>>>>>><br>
>>>>>> Strainu<br>
>>>>>><br>
>>>>>>><br>
>>>>>>> 2013/11/13 Strainu <<a href="mailto:strainu10@gmail.com">strainu10@gmail.com</a>><br>
>>>>>>>><br>
>>>>>>>> Update: Am terminat partea de scanare a codurilor din OSM și am pus<br>
>>>>>>>> niște rezultate parțiale (scanare doar pentru addr:postcode pe<br>
>>>>>>>> noduri)<br>
>>>>>>>> la <a href="https://wiki.openstreetmap.org/wiki/Romanian_Postal_Codes" target="_blank">https://wiki.openstreetmap.org/wiki/Romanian_Postal_Codes</a><br>
>>>>>>>><br>
>>>>>>>> Încă nu fac verificări cu datele de la poștă, sunt doar erori din<br>
>>>>>>>> OSM.<br>
>>>>>>>> De notat că am modificat un pic codurile de eroare pentru o mai bună<br>
>>>>>>>> consecvență în notație:<br>
>>>>>>>>              "E1": u"Nu pot extrage orașul din datele OSM",<br>
>>>>>>>>              "E2": u"Nu pot extrage strada din datele OSM",<br>
>>>>>>>>              "W3": u"Nu pot extrage numărul din datele OSM",<br>
>>>>>>>>              "W4": u"Codul poștal e invalid, conține mai puțin de 6<br>
>>>>>>>> cifre",<br>
>>>>>>>>              "E4": u"Codul poștal e invalid (conține altceva decât 6<br>
>>>>>>>> cifre)",<br>
>>>>>>>>              "E5": u"Nu găsesc codul poștal în datele de la<br>
>>>>>>>> <a href="http://date.gov.ro" target="_blank">date.gov.ro</a>",<br>
>>>>>>>>              "W6": u"Există greșeli în spellingul orașului",<br>
>>>>>>>>              "E6": u"Orașul nu corespunde între OSM și <a href="http://date.gov.ro" target="_blank">date.gov.ro</a>",<br>
>>>>>>>>              "W7": u"Sunt greșeli în spellingul străzii",<br>
>>>>>>>>              "E7": u"Strada nu corespunde între OSM și <a href="http://date.gov.ro" target="_blank">date.gov.ro</a>",<br>
>>>>>>>>              "E8": u"Numărul/blocul nu corespund între OSM și<br>
>>>>>>>> <a href="http://date.gov.ro" target="_blank">date.gov.ro</a>",<br>
>>>>>>>><br>
>>>>>>>> Mi-au atras atenția câteva chestii:<br>
>>>>>>>> * Sunt foarte multe erori E1, ceea ce înseamnă că nu se practică<br>
>>>>>>>> punerea orașului în adresă. Știu că cineva a mai întrebat pe listă<br>
>>>>>>>> dacă e chiar necesar și v-am spus atunci că e nevoie pentru căutări<br>
>>>>>>>> după o anumită cheie. Uite că am dat chiar peste o asemenea situație<br>
>>>>>>>> :) Poate la un moment dat voi face o căutare în zonă ca să detectez<br>
>>>>>>>> orașul, dar deocamdată codurile respective nu vor fi verificare.<br>
>>>>>>>> * Sunt câteva coduri poștale puse de Michael pe noduri din way-uri<br>
>>>>>>>> cu<br>
>>>>>>>> numere cu valoarea <unterschiedlich> (<diferite>, dacă nu mă înșală<br>
>>>>>>>> traducerea automată). Michael, le pui manual sau le pune vreo<br>
>>>>>>>> unealtă?<br>
>>>>>>>> Dacă sunt manuale, care e rolul lor? Un nod reprezintă un număr,<br>
>>>>>>>> deci<br>
>>>>>>>> ar trebui să aibă un singur cod, nu?<br>
>>>>>>>> * Ce alte câmpuri/informații ar mai fi util să pun?<br>
>>>>>>>><br>
>>>>>>>> Spor la corectat :)<br>
>>>>>>>><br>
>>>>>>>> Strainu<br>
>>>>>>>><br>
>>>>>>>> În data de 11 noiembrie 2013, 13:24, Strainu <<a href="mailto:strainu10@gmail.com">strainu10@gmail.com</a>> a<br>
>>>>>>>> scris:<br>
>>>>>>>>><br>
>>>>>>>>> Salut,<br>
>>>>>>>>><br>
>>>>>>>>> Ca primă fază a importului codurilor poștale de la <a href="http://date.gov.ro" target="_blank">date.gov.ro</a>, aș<br>
>>>>>>>>> vrea să generăm o listă cu erori. Mai jos voi descrie procedura pe<br>
>>>>>>>>> care vreau să o urmez, atât pentru a primi feedback, cât și pentru<br>
>>>>>>>>> a<br>
>>>>>>>>> o<br>
>>>>>>>>> avea scrisă undeva.<br>
>>>>>>>>><br>
>>>>>>>>> 1. Extrag toate nodurile și căile cu coduri poștale și încerc să<br>
>>>>>>>>> extrag orașul, strada și numărul; dacă se poate, extrag și numele<br>
>>>>>>>>> blocului. În cazul numerelor de casă  care nu sunt formate doar din<br>
>>>>>>>>> cifre, iau primul număr din text dacă începe de la caracterul 0<br>
>>>>>>>>> (adică<br>
>>>>>>>>> "1A" și "1BIS" sunt "1", dar "A1" e eroare)<br>
>>>>>>>>>   - pentru noduri folosesc "is_in:city" sau ""addr:city",<br>
>>>>>>>>> "addr:street", respectiv "addr:housenumber"<br>
>>>>>>>>>   - pentru căi folosesc "is_in:city", "name" sau "addr:street",<br>
>>>>>>>>> respectiv "addr:housenumber" (dacă avem "addr:street")<br>
>>>>>>>>>   - pentru coduri poștale folosesc "postal_code" sau<br>
>>>>>>>>> "addr:postcode"<br>
>>>>>>>>><br>
>>>>>>>>> 2. Pentru fiecare cod poștal, identific toate intrările din lista<br>
>>>>>>>>> de<br>
>>>>>>>>> la <a href="http://date.gov.ro" target="_blank">date.gov.ro</a> și pentru fiecare dintre ele încerc să fac matching<br>
>>>>>>>>> pe:<br>
>>>>>>>>>   a. oraș; dacă reușesc, merg la b.; dacă nu reușesc, eroare E6.<br>
>>>>>>>>>   b. stradă; dacă reușesc, merg la c.; dacă nu reușesc, eroare E8.<br>
>>>>>>>>>   c. număr; dacă reușesc, succes; dacă nu reușesc, merg la d.<br>
>>>>>>>>>   d. numele blocului; dacă reușesc, succes; dacă nu reușesc, eroare<br>
>>>>>>>>> E10.<br>
>>>>>>>>><br>
>>>>>>>>> Din descriere, complexitatea ar fi pătratică; practic, se poate<br>
>>>>>>>>> optimiza mult aici.<br>
>>>>>>>>><br>
>>>>>>>>> Tipurile de erori aruncate ar fi (E - eroare care nu poate fi<br>
>>>>>>>>> evitată,<br>
>>>>>>>>> W - eroare care poate fi evitată):<br>
>>>>>>>>> E1. Nu pot extrage orașul din datele OSM<br>
>>>>>>>>> E2. Nu pot extrage strada din datele OSM<br>
>>>>>>>>> W3. Nu pot extrage numărul din datele OSM - asta e OK pentru<br>
>>>>>>>>> străzi,<br>
>>>>>>>>> iar pentru restul căilor și nodurilor pot verifica că nu mai există<br>
>>>>>>>>> un<br>
>>>>>>>>> alt cod pe strada respectivă<br>
>>>>>>>>> W4. Codul poștal e invalid, conține 5 cifre: încerc să completez cu<br>
>>>>>>>>> 0<br>
>>>>>>>>> și verific dacă dau în E5<br>
>>>>>>>>> E4. Codul poștal e invalid (conține altceva decât 6 cifre);<br>
>>>>>>>>> E5. Nu găsesc codul poștal în datele de la <a href="http://date.gov.ro" target="_blank">date.gov.ro</a><br>
>>>>>>>>> E6. Orașul nu corespunde între OSM și <a href="http://date.gov.ro" target="_blank">date.gov.ro</a><br>
>>>>>>>>> W7. Sunt greșeli în spelling-ul orașului (de exemplu diacritice<br>
>>>>>>>>> incorecte sau lipsă)<br>
>>>>>>>>> E8. Strada nu corespunde între OSM și <a href="http://date.gov.ro" target="_blank">date.gov.ro</a><br>
>>>>>>>>> W9. Sunt greșeli în spelling-ul străzii (de exemplu diacritice<br>
>>>>>>>>> incorecte sau lipsă sau tip de stradă diferit)<br>
>>>>>>>>> E10. Numărul/blocul nu corespund între OSM și <a href="http://date.gov.ro" target="_blank">date.gov.ro</a><br>
>>>>>>>>><br>
>>>>>>>>><br>
>>>>>>>>> Întrebări deschise:<br>
>>>>>>>>> I1. Mai sunt și alte moduri (chei) de a extrage informațiile din<br>
>>>>>>>>> datele<br>
>>>>>>>>> OSM?<br>
>>>>>>>>> I2. La E1, merită să fac o căutare după limita administrativă care<br>
>>>>>>>>> conține coordonatele respective înainte de a decreta eroare?<br>
>>>>>>>>> I3. La W3, dacă avem mai multe segmente cu coduri diferite, e<br>
>>>>>>>>> acceptabil ca fiecare bucată de stradă să aibă alt cod?<br>
>>>>>>>>><br>
>>>>>>>>> Păreri, opinii?<br>
>>>>>>>>>      Strainu<br>
>>>>>>>><br>
>>>>>>>> _______________________________________________<br>
>>>>>>>> Talk-ro mailing list<br>
>>>>>>>> <a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
>>>>>>>> <a href="https://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ro</a><br>
>>>>>>><br>
>>>>>>><br>
>>>>>>><br>
>>>>>>><br>
>>>>>>> --<br>
>>>>>>> Life is not the amount of times you breathe, is the moments that take<br>
>>>>>>> your<br>
>>>>>>> breath away.<br>
>>>>>>><br>
>>>>>>> To all things comes an end. And to all things comes a beginning.<br>
>>>>>>><br>
>>>>>>> Cred in inspirat, nu in expirat. in vise, nu in somn. In trait, nu in<br>
>>>>>>> existat.<br>
>>>>>>><br>
>>>>>>> _______________________________________________<br>
>>>>>>> Talk-ro mailing list<br>
>>>>>>> <a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
>>>>>>> <a href="https://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ro</a><br>
>>>>>>><br>
>>>>>> _______________________________________________<br>
>>>>>> Talk-ro mailing list<br>
>>>>>> <a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
>>>>>> <a href="https://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ro</a><br>
>>>>><br>
>>>>><br>
>>>>><br>
>>>>><br>
>>>>> --<br>
>>>>> Life is not the amount of times you breathe, is the moments that take<br>
>>>>> your<br>
>>>>> breath away.<br>
>>>>><br>
>>>>> To all things comes an end. And to all things comes a beginning.<br>
>>>>><br>
>>>>> Cred in inspirat, nu in expirat. in vise, nu in somn. In trait, nu in<br>
>>>>> existat.<br>
>>>>><br>
>>>>> _______________________________________________<br>
>>>>> Talk-ro mailing list<br>
>>>>> <a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
>>>>> <a href="https://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ro</a><br>
>>>>><br>
>> _______________________________________________<br>
>> Talk-ro mailing list<br>
>> <a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
>> <a href="https://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ro</a><br>
><br>
><br>
><br>
> _______________________________________________<br>
> Talk-ro mailing list<br>
> <a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
> <a href="https://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ro</a><br>
<br>
_______________________________________________<br>
Talk-ro mailing list<br>
<a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">https://lists.openstreetmap.org/listinfo/talk-ro</a><br>
</blockquote></div><br></div>