Re: Értékek automatikus vagy félautomatikus javítása

Thomas Nagy bkil.hu at gmail.com
2019. Jan. 12., Szo, 12:11:32 UTC


Támogatom az elképzelést. A megvalósítástól függően lehet ez a géppel 
parszolható patch tábla OSM Wikiben, GitHub wikiben vagy GitHub kódban. 
Valójában kiindulásnak az se rossz ha az OSM wikiben már meglevő oldalakon 
található "possible tagging mistakes" részt ketté bontjuk, és bevezetünk 
egy definite mistaggings felsorolást - ezt is használhatja adatforrásnak.

(name|description|drinking_water)=.*\<(Ivó|([kK]öz|[nN]yomós|kék) *kút).*
name:en=Drinking water
name=Tűzcsap
name=Szobor
name=[kK]út (itt fog kelleni pár szabály)
(description|name)=(Iható|ivó) *víz/drinking_water=yes vagy amenity, 
többitől függ
(description|name)=.*nem iható.*/drinking_water=no
wifi=*/internet_access=wlan + ...
wifiname=*/internet_access:ssid=*
wif_iname=*/internet_access:ssid=*
WIFI:SSID=*/internet_access:ssid=*
note=speed camera sensor
name(:en?)=[Ss]peed [Cc]amera
surveillance=camera
name=Camera
name=[aA][bB][cC]
amenity=(.*)center/amenity=\1centre
name=Lépcső
name=Lift
name=[Ss]zökőkút
internet=*
...

Úgy általában a primary tag nélküli dolgok gyanúsak, de mintha erre volna 
validátor. Inkább akkor érdekesebb, ha ellentétes a szó jelentése a primary 
taggel.

Az iD által beerőszakolt _1, _2, stb. kulcsokkal is jó volna valamit 
kezdeni. Sokfelé előfordul, de például website esetén szét lehet válogatni 
provider szerint és átrakni a megfelelő contact:* kulcsba. Esetleg name 
esetén ha csak kettő van, a szerkesztés előttit berakhatjuk az old_name-be, 
bár ez nem 100% korrekt, mert lehet alt_name is, de a keresők így legalább 
mindkettőt megtalálnák. Valamit át lehet alakítani pontosvesszőre vagy 
namespace-be, de ehhez domain specifikus tudást kell lekódolni. Az 
ellentmondásos primary tag jelentések tipikusan szét kell bontani vagy 
törölni az egyiket, de ez általában igényel emberi beavatkozást.

https://taginfo.openstreetmap.org/search?q=_1
https://taginfo.openstreetmap.org/search?q=_4

On Saturday, January 12, 2019 at 12:06:38 PM UTC+1, Úr Balázs wrote:
>
> Sziasztok! 
>
> A taginfot nézegetve azt vettem észre, hogy sok olyan érték van, amit 
> automatikusan lehet javítani, akár helyismeret nélkül is. Egy részét már 
> javítottam. Például: 
>
> Ha kulcs "maxspeed:source", akkor kulcs cseréje erre: "source:maxspeed" 
>
> Ez eléggé triviális javítás, akár automatizálható is. Vannak viszont 
> olyan hibák, amiket át kell nézni, de nagy valószínűség szerint szintén 
> tömegesen javíthatók (félautomatikusan). Például: 
>
> Ha "addr:housenumber" tartalmaz pontot, akkor a pont eltávolítása. 
>
> Ha "addr:housenumber" tartalmazza, hogy "hrsz", akkor érték átírása az 
> "addr:conscriptionnumber" kulcsba ("hrsz" nélkül) és "addr:housenumber" 
> törlése. 
>
> Ha "description" = "Kőkereszt" vagy "kereszt kőből", akkor 
> "material:stone" és "description" törlése. 
>
> Ha "description" = "Fakereszt", akkor "material:wood" és "description" 
> törlése. 
>
> Ha "description" = "magasles" és "amenity" = "hunting_stand", akkor 
> "description" törlése. 
>
> És még rengeteg ilyen triviális javítás fordulhat elő. Ha meghatározunk 
> olyan feltételeket, amit figyeljen egy script, akkor ebből gyártható 
> lenne egy napi frissítésű táblázat. Azaz gyűjtsünk össze minél több 
> olyan feltételt, amely triviális és gyakori hibákat keres, ebből 
> készüljön egy táblázat, amit egyesével átnézve lehetne javítani az 
> adatokat. 
>
> Az ötletem eddig tartott, a megvalósítást rábíznám valakire, aki jártas 
> ilyenekben. 
>
> Ha van ötleted olyan feltételre, amely triviális hibát keres (és javít), 
> akkor ebbe a szálba válaszul küldd be. 
>
> -- Balázs 
>
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: <http://lists.openstreetmap.org/pipermail/talk-hu/attachments/20190112/3b915999/attachment.htm>


További információk a(z) Talk-hu levelezőlistáról