<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Szia Kami,<div><br></div><div>>Örömmel várom, ha van ötlet még ezen kívül, vagy bármi gondolat a témában.<br><br>folyamatosan változik a best-practice ... <br><br></div><div>de pár tipp kipróbálásra:</div><div><br></div><div>az utcanévellenörzőnél normalizáltam az utcaneveket, lehet, hogy itt is ki kellene próbálni.</div><div>- az ékezeteket "rövidítettem" </div><div>- dr/utca/ut/utja - szavakat eltávolítottam</div></div></div></div><blockquote style="margin:0px 0px 0px 40px;border:none;padding:0px"><div><div><div><div><font face="monospace, monospace"><br></font></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff">CREATE OR REPLACE FUNCTION UTCANEV_TISZTIT(utcanev text) RETURNS text as $$</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff">BEGIN </font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff"> RETURN translate( regexp_replace(</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff"> translate( lower( ( utcanev)) , 'őúáűéíó-.,','öuaüeio') ,</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff"> '[[:<:]](dr|utca|ut|utja)[[:>:]]',</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff"> ' ',</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff"> 'gi'</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff">),' ','');</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff">END ;</font></div></div></div></div></div><div><div><div><div><div><font face="monospace, monospace" color="#0000ff">$$ LANGUAGE plpgsql IMMUTABLE;</font></div></div></div></div></div></blockquote><div dir="ltr"><div dir="ltr"><div dir="ltr"><div><br></div><div><br></div><div>Valamint most a kedvencem a "Jaro-Winkler Distance" ( <a href="https://github.com/eulerto/pg_similarity">https://github.com/eulerto/pg_similarity</a> )<br></div><div><br></div><div>üdv,</div><div> Imre</div><div><br></div><div><br></div><div><br></div><div><br></div></div></div></div></div></div></div><br><div class="gmail_quote"><div dir="ltr">KAMI911 KAMI911 <<a href="mailto:kami911@gmail.com">kami911@gmail.com</a>> ezt írta (időpont: 2018. dec. 23., V, 12:18):<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div>Sziasztok, egyelőre a QC-ben bevezettem két ellenőrzést:</div><div><br></div><div> <!-- Checker good: {not_in_water,street_metaphone_is_around,standard_opening_hours}; bad {street_is_not_around}--><br></div><div><br></div><div>street_is_not_around - van/nincs olyan nevű utca az OSM-en a környéken, amely a POI addr:street mezőjében szerepel<br></div><div>street_metaphone_is_around - van/nincs olyan hangzású nevű utca az OSM-en a környéken, amely a POI addr:street mezőjében szerepel (kb az út-utca keveréseket tudja kiszűrni)</div><div><br></div><div>Egyelőre nincs ezeknek a teszten kivül semmi eredménye, de ha szerintetk hasznos és megbízható, esetleg be lehet vezetni, hogy a találatoknál legyen felülírva a POI addr:street adata.</div><div><br></div><div>Nagyjából ezek a lekérdezések állnak a háttérben:</div><div><br></div><div>Utcanév megtalálás a környéken, ha a név azonos (validátorhoz):<br>SELECT name, osm_id, highway, ST_Distance_Sphere(ST_Transform(way, 4326), point.geom) as distance, way, ST_AsEWKT(way) as way_ewkt<br> FROM planet_osm_roads, (SELECT ST_SetSRID(ST_MakePoint(19.03207,47.47248),4326) as geom) point<br> WHERE name = 'Bartók Béla út' AND highway is not NULL<br> AND ST_DWithin(ST_Buffer(way,3),ST_Transform(point.geom,3857), 300)<br> ORDER BY distance ASC;<br><br>Utcanév megtalálás a környéken, ha a név azonos:<br>SELECT name, osm_id, highway, ST_Distance_Sphere(ST_Transform(way, 4326), point.geom) as distance, way, ST_AsEWKT(way) as way_ewkt<br> FROM planet_osm_roads, (SELECT ST_SetSRID(ST_MakePoint(19.03207,47.47248),4326) as geom) point<br> WHERE dmetaphone(name) = dmetaphone('Bartók Béla út') AND highway is not NULL<br> AND ST_DWithin(ST_Buffer(way,3),ST_Transform(point.geom,3857), 300)<br> ORDER BY distance ASC;<br><br>Ugyanez, amikor út helyett utca van:<br>SELECT name, osm_id, highway, ST_Distance_Sphere(ST_Transform(way, 4326), point.geom) as distance, way, ST_AsEWKT(way) as way_ewkt<br> FROM planet_osm_roads, (SELECT ST_SetSRID(ST_MakePoint(19.03207,47.47248),4326) as geom) point<br> WHERE dmetaphone(name) = dmetaphone('Bartók Béla utca') AND highway is not NULL<br> AND ST_DWithin(ST_Buffer(way,3),ST_Transform(point.geom,3857), 300)<br> ORDER BY distance ASC;<br><br>SELECT name, osm_id, highway, ST_Distance_Sphere(ST_Transform(way, 4326), point.geom) as distance, way, ST_AsEWKT(way) as way_ewkt<br> FROM planet_osm_roads, (SELECT ST_SetSRID(ST_MakePoint(21.07252,47.93337),4326) as geom) point<br> WHERE dmetaphone(name) = dmetaphone('Petőfi Sándor út') AND highway is not NULL<br> AND ST_DWithin(ST_Buffer(way,3),ST_Transform(point.geom,3857), 300)<br> ORDER BY distance ASC;</div><div><br></div><div>Örömmel várom, ha van ötlet még ezen kívül, vagy bármi gondolat a témában.</div><div><br></div><div> <br></div><div><div><div><div dir="ltr" class="gmail-m_-5121972794067590642gmail_signature"><div dir="ltr">Üdvözlettel / Best Regards:<br><br>Kálmán (KAMI) Szalai<br></div></div></div><br></div></div></div></div></div><br><div class="gmail_quote"><div dir="ltr">KAMI911 KAMI911 <<a href="mailto:kami911@gmail.com" target="_blank">kami911@gmail.com</a>> ezt írta (időpont: 2018. dec. 20., Cs, 14:59):<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div>Sziasztok,</div><div><br></div><div>Lehet elérkezett az idő hogy ez az egész import témát egybe kezeljük. Persze az importok külön-külön mennek, de a hibákat kereshetjük globálisan.</div><div><br></div><div>Ahogy átírtam a programot, sok-sok duplikátum megszűnt, ettől függetlenül érdemes lenne jobb adatokat megadni, hogy milyenek legyenek a keresési sugár értékek, safe (név és tag egyezés) és unsafe (csak tag egyezés) esetben. Szóval most sokkal jobbak a kilátások, de elkezdtem nézni a duplikátumokat és az AVIA-nál Martonvásárnál két poi is van egyik a település nevével, a másik Szabó Brigitta névvel. Jelezem nekik.</div><div>A Benunál a duplikálást az okozza, hogy két külön poi azonos GEOM-mal rendelkezik.<br></div><div><br></div><div>Van kedvetek a továbbiakat megfejteni, hogy mi a gond velük? És persze ha nem a mi hibánk akkor be is kellene jelenteni a cégeknek.<br></div><div><br></div><div>Természetesen az új elemekre is rá lehetne nézni, hogy biztos nem lesz valami duplikátum a működés révén.</div><div><br></div><div>Imrével már beszélgettük, hogyan lehetne szűrni az új és duplikált POI-kat mégvagy a megfelelő utcaelnevezéssel eltalálni, megadni, de akinek van valami ötlete, azt szívesen vesszük.</div><div><br></div><div>Frissített adatok:</div><div><a href="https://github.com/KAMI911/osm-import-request" target="_blank">https://github.com/KAMI911/osm-import-request</a></div><div><br></div><div>Most itt tartunk:</div><div><br></div><div>-----<br>300<br><br>./hu_avia/poi_address_merge_huaviafu.osm<br> 2 <!-- OSM link: <a href="https://osm.org/node/320586750" target="_blank">https://osm.org/node/320586750</a> --><br>Duplicated elements: 1<br>New elements: 39<br><br>./hu_benu/poi_address_merge_hubenupha.osm<br> 2 <!-- OSM link: <a href="https://osm.org/node/3520336469" target="_blank">https://osm.org/node/3520336469</a> --><br>Duplicated elements: 1<br>New elements: 125<br><br>./hu_bp_bank/poi_address_merge_hubpatm.osm<br>Duplicated elements: 0<br>New elements: 111<br><br>./hu_bp_bank/poi_address_merge_hubpbank.osm<br>Duplicated elements: 0<br>New elements: 24<br><br>./hu_cba/poi_address_merge_hucbacon.osm<br> 2 <!-- OSM link: <a href="https://osm.org/node/4251192415" target="_blank">https://osm.org/node/4251192415</a> --><br>Duplicated elements: 1<br>New elements: 200<br><br>./hu_dm/poi_address_merge_hudmche.osm<br>Duplicated elements: 0<br>New elements: 86<br><br>./hu_foxpost/poi_address_merge_hufoxpocso.osm<br>Duplicated elements: 0<br>New elements: 98<br><br>./hu_kh/poi_address_merge_hukhatm.osm<br>Duplicated elements: 0<br>New elements: 374<br><br>./hu_kh/poi_address_merge_hukhbank.osm<br>Duplicated elements: 0<br>New elements: 73<br><br>./hu_kulcs/poi_address_merge_hukulcspha.osm<br>Duplicated elements: 0<br>New elements: 63<br><br>./hu_mobil_petrol/poi_address_merge_humobpefu.osm<br>Duplicated elements: 0<br>New elements: 2<br><br>./hu_mol/poi_address_merge_humolfu.osm<br> 2 <!-- OSM link: <a href="https://osm.org/node/2302639399" target="_blank">https://osm.org/node/2302639399</a> --><br> 2 <!-- OSM link: <a href="https://osm.org/way/434836133" target="_blank">https://osm.org/way/434836133</a> --><br>Duplicated elements: 2<br>New elements: 25<br><br>./hu_mol_bubi/poi_address_merge_hububibir.osm<br>Duplicated elements: 0<br>New elements: 3<br><br>./hu_omv/poi_address_merge_huomvfu.osm<br>Duplicated elements: 0<br>New elements: 16<br><br>./hu_posta/poi_address_merge_hupostacse.osm<br>Duplicated elements: 0<br>New elements: 115<br><br>./hu_posta/poi_address_merge_hupostacso.osm<br>Duplicated elements: 0<br>New elements: 50<br><br>./hu_posta/poi_address_merge_hupostapo.osm<br>Duplicated elements: 0<br>New elements: 1233<br><br>./hu_posta/poi_address_merge_hupostapp.osm<br> 2 <!-- OSM link: <a href="https://osm.org/node/3469960863" target="_blank">https://osm.org/node/3469960863</a> --><br>Duplicated elements: 1<br>New elements: 450<br><br>./hu_prima/poi_address_merge_huprimacon.osm<br>Duplicated elements: 0<br>New elements: 36<br><br>./hu_rossmann/poi_address_merge_hurossmche.osm<br>Duplicated elements: 0<br>New elements: 76<br><br>./hu_shell/poi_address_merge_hushellfu.osm<br>Duplicated elements: 0<br>New elements: 3<br><br>./hu_spar/poi_address_merge_husparexp.osm<br>Duplicated elements: 0<br>New elements: 61<br><br>./hu_spar/poi_address_merge_husparint.osm<br>Duplicated elements: 0<br>New elements: 16<br><br>./hu_spar/poi_address_merge_husparsup.osm<br> 2 <!-- OSM link: <a href="https://osm.org/node/1243005712" target="_blank">https://osm.org/node/1243005712</a> --><br> 2 <!-- OSM link: <a href="https://osm.org/way/228874975" target="_blank">https://osm.org/way/228874975</a> --><br> 2 <!-- OSM link: <a href="https://osm.org/way/420910894" target="_blank">https://osm.org/way/420910894</a> --><br>Duplicated elements: 3<br>New elements: 150<br><br>./hu_tesco/poi_address_merge_hutescoexp.osm<br>Duplicated elements: 0<br>New elements: 2<br><br>./hu_tesco/poi_address_merge_hutescoext.osm<br>Duplicated elements: 0<br>New elements: 0<br><br>./hu_tesco/poi_address_merge_husmrktexp.osm<br>Duplicated elements: 0<br>New elements: 2<br><br>./hu_tesco/poi_address_merge_hutescosup.osm<br>Duplicated elements: 0<br>New elements: 2</div><div><br></div><div><div><div dir="ltr" class="gmail-m_-5121972794067590642gmail-m_-7873921911688397351gmail_signature"><div dir="ltr">Üdvözlettel / Best Regards:<br><br>Kálmán (KAMI) Szalai<br></div></div></div></div></div></div></div></div>
</blockquote></div>
<p></p>
-- <br>
Magyar OSM Levelezőlista - <a href="mailto:openstreetmap-hungary@googlegroups.com" target="_blank">openstreetmap-hungary@googlegroups.com</a><br>
leiratkozás: <a href="mailto:openstreetmap-hungary%2Bunsubscribe@googlegroups.com" target="_blank">openstreetmap-hungary+unsubscribe@googlegroups.com</a><br>
--- <br>
Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok „openstreetmap-hungary” csoportjára.<br>
Az erről a csoportról és az ahhoz kapcsolódó e-mailekről való leiratkozáshoz küldjön egy e-amailt a(z) <a href="mailto:openstreetmap-hungary+unsubscribe@googlegroups.com" target="_blank">openstreetmap-hungary+unsubscribe@googlegroups.com</a> címre.<br>
További lehetőségekért látogasson el ide: <a href="https://groups.google.com/d/optout" target="_blank">https://groups.google.com/d/optout</a>.<br>
</blockquote></div>