Salut<div><br></div><div>Cu urmatoarele SQL-uri (posgresql, postgis) am facut o detectie a duplicatelor existente in extrasul de azi 18 Jun luat de pe <a href="http://stalpu.org">stalpu.org</a>:</div><div><br></div><div><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">
<font class="Apple-style-span" face="'courier new', monospace">create or replace function strip_diac(varchar) returns varchar as $$DECLARE</font></p>
<p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica"><font class="Apple-style-span" face="'courier new', monospace">  src ALIAS FOR $1;  result VARCHAR;</font></p>
<p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica"><font class="Apple-style-span" face="'courier new', monospace">BEGIN  result := TRANSLATE(src, E'\xc3\x82\xc3\x83\xc3\xa2\xc3\xa3\xc4\x82\xc3\x8e\xc3\xae\xc5\x9e\xc5\x9f\xc5\xa2\xc3\xa3\xc7\x8d\xc7\x8e\xc8\x98\xc8\x99\xc8\x9a\xc8\x9B\xc3\x83', 'AaaaAIiSsTtAaSsTtA');</font></p>

<p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica"><font class="Apple-style-span" face="'courier new', monospace">return result;END;</font></p>
<p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica"><font class="Apple-style-span" face="'courier new', monospace">$$ LANGUAGE 'plpgsql' IMMUTABLE;</font></p>
<p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica; min-height: 14.0px"><font class="Apple-style-span" face="'courier new', monospace"><br></font></p>
<p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica"><font class="Apple-style-span" face="'courier new', monospace">select <a href="http://p1.name">p1.name</a>, <a href="http://p2.name">p2.name</a>, p1.osm_id, p2.osm_id, p1.place, p2.place, distance(p1.way, p2.way) from planet_osm_point p1, planet_osm_point p2  where p1.place !='' and p2.place!='' and p1.osm_id != p2.osm_id and distance(p1.way, p2.way) < 5000 and lower(strip_diac(<a href="http://p1.name">p1.name</a>)) = lower(strip_diac(<a href="http://p2.name">p2.name</a>)) order by strip_diac(<a href="http://p1.name">p1.name</a>), p1.osm_id desc;</font></p>
<p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica"><br></p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">Secventele de escape diacrice sunt cele folosite in xybot.</p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">
Fisierul de duplicate (160 de intrari) este atasat. Cele cu cel putin un OSM_ID > 400 de milioane sunt cele din importul recent al lui Nini, restul sunt istorice.</p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">
<br></p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">Planul nostru este sa re-rulam detectia de duplicate si reconcilierea efectiva dupa ce terminam cu importul.</p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">
<br></p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">Daca aveti alte propuneri pentru continuarea importului, va rugam sa ni le comunicati.</p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">
<br></p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">Multumesc,</p><p style="margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica">Cristi</p><br><div class="gmail_quote">2009/6/18 Eddy Petrișor <span dir="ltr"><<a href="mailto:eddy.petrisor@gmail.com">eddy.petrisor@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">În data de 17 iunie 2009, 23:08, Francisc TOTH <<a href="mailto:yo6own@yahoo.com">yo6own@yahoo.com</a>> a scris:<br>

<div class="im">><br>
> Eu am folosit JOSM: am comparat datele sa fiu sigur ca nu distrug vreo informatie, am copiat datele noi peste<br>
> cele vechi cu CTRL-C, CTRL-SHIFT-V si am sters punctul vechi. Nu am mutat punctul vechi, de obicei era plasat<br>
<br>
</div>Datele VECHI trebuie să aibă precedență față de datele noi, exceptând<br>
câteva situații particulare!<br>
<br>
De obicei datele existente sunt obținute din sondaje locale sau surse<br>
locale, deci au șanse să fie mai corecte decât cele din import.<br>
<br>
Asta este una din modalitățile prin care importul o ia razna și face<br>
mai mult rău decât bine.<br>
<div class="im"><br>
<br>
> mai la drum decat punctul nou, pe care intr-un caz l-am gasit exact pe calea ferata. In sate centrul e traditional<br>
> mai pe langa biserica, in oras pe langa primarie. Daca tot eram cu editarea am preschimbat si codul postal<br>
> vechi cu cel nou si gata.<br>
<br>
</div>Poate era util să se păstreze codul pustal vechi într-un câmp dedicat<br>
(old_postal_code sau siruta:old_postal_code), așa cum am sugerat.<br>
<div class="im"><br>
<br>
--<br>
Regards,<br>
EddyP<br>
=============================================<br>
"Imagination is more important than knowledge" A.Einstein<br>
<br>
_______________________________________________<br>
Talk-ro mailing list<br>
</div><div><div></div><div class="h5"><a href="mailto:Talk-ro@openstreetmap.org">Talk-ro@openstreetmap.org</a><br>
<a href="http://lists.openstreetmap.org/listinfo/talk-ro" target="_blank">http://lists.openstreetmap.org/listinfo/talk-ro</a><br>
</div></div></blockquote></div><br><br clear="all"><br>
</div>