<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Megjegyzem, hogy vannak lukak a keresési térben. Akadna itt még start_date is, viszont én itt csak székhelyet láttam, fióktelepek-telephelyek-üzletek címét pont nem (az külön lekérdezés lenne), így a legtöbb POI-ra ez felhasználói oldalról nézve kis hasznosságú. Esetleg arra jó lehet, hogy automatikus frissítés és operator összerendelés alapján értesüljünk a bolt bezárásokról vagy tulajdonos váltásokról, amit lehet (fél-)automatikusan javítani is.</div><div dir="ltr"><br></div><div dir="ltr">Ezekről az adatokról (beleértve az üzletek címét is) szintén vannak máshol hatósági nyilvántartások mind központilag, mind az önkormányzatoknál (utóbbi a PDF-es téma amit a másik szálban beszéltünk, de sajnos nem friss). Egyelőre nem tudom, hogy milyen közösen látható felületet találjunk ki az utóbbiról már beparszolt adatokra, de mapping party előtt mindenképpen kinyomtatjuk és kiosztjuk.<div><br></div><div><a href="https://groups.google.com/d/topic/openstreetmap-hungary/fu7om2fH3B8/discussion">https://groups.google.com/d/topic/openstreetmap-hungary/fu7om2fH3B8/discussion</a><br></div><div><br></div><div>A meglátásom szerint a <a href="http://xn--cginformci-z4a2g0g.hu">céginformáció.hu</a> adatbázisának a duplikálása se nem etikus, se nem legális. A cégközlönyben jelentik be az összes cégalapítást-módosítást, amibe nem is kevés pénzért lehet (és kell is) publikálni, annak az automatizált lehúzását már helyeselném, viszont a mókás emberek ott kitalálták, hogy CAPTCHA-t raknak fel, és pénzért fogják árulni az API-t az olyanoknak mint a <a href="http://xn--cginformci-z4a2g0g.hu">céginformáció.hu</a>.<br><div><br></div><div>És mi az update stratégiád, havonta crawl-oljuk újra a millió rekordot? Kötve hiszem, hogy pár hónap után ne vennék észre, így nem hangzik túl fenntarthatónak. Ugyanezzel a megközelítéssel (rendszeres adatlopással) új versenytársak is üzemelhetnének, és ezt ők nyilván törekszenek kiküszöbölni. Vagy titokban csak egy-egy mapping party előtt crawlolnád le, hogy meglegyen a lista amit a terepen ellenőrizni kell? Sokkal fenntarthatóbbnak hangzik, ha esetleg rákérdeznénk, nem adják-e ide az adatbázis dumpot rendszeresen OSM célra - nekik is kevesebb sávszélesség és processzoridő lenne, nekünk pedig a fehérség eufóriája.</div></div><div><br></div><div>Mint kiderült amúgy a következő a hiteles forrás adatbázis:</div><div><a href="http://ceginformaciosszolgalat.kormany.hu/ingyenes-ceginformacio">http://ceginformaciosszolgalat.kormany.hu/ingyenes-ceginformacio</a><br></div><div><br></div><div><div>Eszerint: "Online, tájékoztató jellegű ingyenes céginformáció a <a href="http://www.e-cegjegyzek.hu">www.e-cegjegyzek.hu</a> honlapon keresztül érhető el"</div></div><div><br></div><div>Ezt pedig CAPTCHA védi, tehát itt bezárult a kör: ezt az adatbázist csak úgy nem duplikálhatjuk sem direkten, sem partneren keresztül. Félelmetes ez a closed-data mánia az országban.</div></div></div></div></div><br><div class="gmail_quote"><div dir="ltr">On Wed, Jan 16, 2019 at 7:50 PM Úr Balázs <<a href="mailto:urbalazs@openstreetmap.hu">urbalazs@openstreetmap.hu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">2019. 01. 16. 18:24 keltezéssel, Tamás Vásony írta:<br>
> <a href="https://www.ceginformacio.hu/cr9310511889" rel="noreferrer" target="_blank">https://www.ceginformacio.hu/cr9310511889</a><br>
<br>
Ez elég jó kis oldal, captcha nélkül le lehet rántani cégadatokat.<br>
<br>
ID = 1<br>
<a href="https://www.ceginformacio.hu/cr9310000001" rel="noreferrer" target="_blank">https://www.ceginformacio.hu/cr9310000001</a><br>
<br>
Utolsó ID = 658973<br>
<a href="https://www.ceginformacio.hu/cr9310658973" rel="noreferrer" target="_blank">https://www.ceginformacio.hu/cr9310658973</a><br>
<br>
for (id = 1; id <= 658973; id++) {<br>
# wget ...<br>
# parse ...<br>
}<br>
<br>
Ezeket lehet kinyerni, ha jól látom.<br>
<br>
operator=<br>
operator:addr=<br>
addr:postalcode=<br>
addr:city=<br>
addr:street=<br>
addr:housenumber=<br>
contact:website=<br>
ref:vatin=<br>
ref:vatin:hu=<br>
ref:company:hu=<br>
<br>
A felhasználhatósága erősen kétséges, de saját használatra még jó lehet.<br>
Nekiesik valaki, vagy eresszek rá egy scriptet?<br>
<br>
-- Balázs<br>
<br>
-- <br>
Magyar OSM Levelezőlista - <a href="mailto:openstreetmap-hungary@googlegroups.com" target="_blank">openstreetmap-hungary@googlegroups.com</a><br>
leiratkozás: <a href="mailto:openstreetmap-hungary%2Bunsubscribe@googlegroups.com" target="_blank">openstreetmap-hungary+unsubscribe@googlegroups.com</a><br>
--- <br>
Azért kapta ezt az üzenetet, mert feliratkozott a Google Csoportok keretében működő openstreetmap-hungary csoportra.<br>
A témáról való leiratkozáshoz látogasson el ide: <a href="https://groups.google.com/d/topic/openstreetmap-hungary/oZrtLUn3hnw/unsubscribe" rel="noreferrer" target="_blank">https://groups.google.com/d/topic/openstreetmap-hungary/oZrtLUn3hnw/unsubscribe</a>.<br>
Az erről a csoportról és minden témájáról való leiratkozáshoz küldjön egy e-mailt a(z) <a href="mailto:openstreetmap-hungary%2Bunsubscribe@googlegroups.com" target="_blank">openstreetmap-hungary+unsubscribe@googlegroups.com</a> címre.<br>
További lehetőségekért látogasson el a(z) <a href="https://groups.google.com/d/optout" rel="noreferrer" target="_blank">https://groups.google.com/d/optout</a> címre.<br>
</blockquote></div></div>