Re: Értékek automatikus vagy félautomatikus javítása
Thomas Nagy
bkil.hu at gmail.com
2019. Jan. 12., Szo, 12:11:32 UTC
Támogatom az elképzelést. A megvalósítástól függően lehet ez a géppel
parszolható patch tábla OSM Wikiben, GitHub wikiben vagy GitHub kódban.
Valójában kiindulásnak az se rossz ha az OSM wikiben már meglevő oldalakon
található "possible tagging mistakes" részt ketté bontjuk, és bevezetünk
egy definite mistaggings felsorolást - ezt is használhatja adatforrásnak.
(name|description|drinking_water)=.*\<(Ivó|([kK]öz|[nN]yomós|kék) *kút).*
name:en=Drinking water
name=Tűzcsap
name=Szobor
name=[kK]út (itt fog kelleni pár szabály)
(description|name)=(Iható|ivó) *víz/drinking_water=yes vagy amenity,
többitől függ
(description|name)=.*nem iható.*/drinking_water=no
wifi=*/internet_access=wlan + ...
wifiname=*/internet_access:ssid=*
wif_iname=*/internet_access:ssid=*
WIFI:SSID=*/internet_access:ssid=*
note=speed camera sensor
name(:en?)=[Ss]peed [Cc]amera
surveillance=camera
name=Camera
name=[aA][bB][cC]
amenity=(.*)center/amenity=\1centre
name=Lépcső
name=Lift
name=[Ss]zökőkút
internet=*
...
Úgy általában a primary tag nélküli dolgok gyanúsak, de mintha erre volna
validátor. Inkább akkor érdekesebb, ha ellentétes a szó jelentése a primary
taggel.
Az iD által beerőszakolt _1, _2, stb. kulcsokkal is jó volna valamit
kezdeni. Sokfelé előfordul, de például website esetén szét lehet válogatni
provider szerint és átrakni a megfelelő contact:* kulcsba. Esetleg name
esetén ha csak kettő van, a szerkesztés előttit berakhatjuk az old_name-be,
bár ez nem 100% korrekt, mert lehet alt_name is, de a keresők így legalább
mindkettőt megtalálnák. Valamit át lehet alakítani pontosvesszőre vagy
namespace-be, de ehhez domain specifikus tudást kell lekódolni. Az
ellentmondásos primary tag jelentések tipikusan szét kell bontani vagy
törölni az egyiket, de ez általában igényel emberi beavatkozást.
https://taginfo.openstreetmap.org/search?q=_1
https://taginfo.openstreetmap.org/search?q=_4
On Saturday, January 12, 2019 at 12:06:38 PM UTC+1, Úr Balázs wrote:
>
> Sziasztok!
>
> A taginfot nézegetve azt vettem észre, hogy sok olyan érték van, amit
> automatikusan lehet javítani, akár helyismeret nélkül is. Egy részét már
> javítottam. Például:
>
> Ha kulcs "maxspeed:source", akkor kulcs cseréje erre: "source:maxspeed"
>
> Ez eléggé triviális javítás, akár automatizálható is. Vannak viszont
> olyan hibák, amiket át kell nézni, de nagy valószínűség szerint szintén
> tömegesen javíthatók (félautomatikusan). Például:
>
> Ha "addr:housenumber" tartalmaz pontot, akkor a pont eltávolítása.
>
> Ha "addr:housenumber" tartalmazza, hogy "hrsz", akkor érték átírása az
> "addr:conscriptionnumber" kulcsba ("hrsz" nélkül) és "addr:housenumber"
> törlése.
>
> Ha "description" = "Kőkereszt" vagy "kereszt kőből", akkor
> "material:stone" és "description" törlése.
>
> Ha "description" = "Fakereszt", akkor "material:wood" és "description"
> törlése.
>
> Ha "description" = "magasles" és "amenity" = "hunting_stand", akkor
> "description" törlése.
>
> És még rengeteg ilyen triviális javítás fordulhat elő. Ha meghatározunk
> olyan feltételeket, amit figyeljen egy script, akkor ebből gyártható
> lenne egy napi frissítésű táblázat. Azaz gyűjtsünk össze minél több
> olyan feltételt, amely triviális és gyakori hibákat keres, ebből
> készüljön egy táblázat, amit egyesével átnézve lehetne javítani az
> adatokat.
>
> Az ötletem eddig tartott, a megvalósítást rábíznám valakire, aki jártas
> ilyenekben.
>
> Ha van ötleted olyan feltételre, amely triviális hibát keres (és javít),
> akkor ebbe a szálba válaszul küldd be.
>
> -- Balázs
>
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: <http://lists.openstreetmap.org/pipermail/talk-hu/attachments/20190112/3b915999/attachment.htm>
További információk a(z) Talk-hu levelezőlistáról