[Talk-dk] autoAWS første udkast

Ole Laursen ole.laursen at gmail.com
Ons Apr 18 07:16:23 UTC 2018


Hej Jonathan

18. april 2018 kl. 08.13 skrev Jonathan Hougaard <hougaardjk at gmail.com>:
> Jeg er med på, at data fra DAR ikke er 100% korrekt. Det ændrer ikke ved, at
> det er den tilgang,  jeg er nødt til at have. Hvis jeg derimod skal antage,
> at data fra DAR som udgangspunkt er forkert, kan vi jo lige så godt droppe
> importen.

Beklager, jeg skulle måske have uddybet før - jeg havde indtryk af at
du havde læst tilbage på postlisten, det lød sådan på din første
email.

Den oprindelige robot havde nøjagtig den tilgang du skriver nu.

Det resulterede så i at flere tusinde adresseknuder havde absurde
vejnavne, som Niels lige har illustreret. En tid ignorerede vi
problemet og opkaldte bare vejene korrekt. Men så fik vi det problem
at inkonsistensværktøjerne jo sammenligner vejnavne med nærliggende
adresseknuder og melder fejl hvis der ikke er overensstemmelse.

Det gik vi så i fællesskab og spekulerede over et stykke tid indtil
jeg så lavede

https://oisfixes.iola.dk

Kan jeg overtale dig til at prøve at bruge bare 5 minutter inde på den side?

Løsningen var, som du kan se, at lave en database over fejl i DAR. Det
havde to formål: robotten kunne så rette vejnavnene til når den
importerede, og kommunerne kunne gå ind og se fejl i deres data.

Logikken er ret enkel: der er en JSON-grænseflade som importeren
starter med at hente data fra, putter i et associativt array og slår
op om der er en rettelse hver gang den processerer en knude.

Nu fandt jeg lige den email hvor Peter Brodersen skrev at han havde
fået importeren til at tage rettelser ind fra oisfixes:

https://lists.openstreetmap.org/pipermail/talk-dk/2011-September/001818.html

Så det er ikke sådan at du behøver at bruge lang tid på at genopfinde
fejlhåndtering - vi har allerede været det igennem. Det er muligt
arbejdsgangen kan være smartere - hvis du har et forslag, så vil jeg
gerne kigge på at omkode eller evt. afvikle oisfixes.

> Du har helt ret i, at der sikkert både er og vil komme nye fejl i
> DAR-dataen. 100% korrekt data findes i denne sammenhæng ikke. Jeg mener dog
> stadig, at den 99% korrekte data vi kan hente fra DAR er langt bedre end
> manuel tilretning af samtlige adresser i Danmark, hvilket er helt
> urealistisk.

Jeg tror du lige skal et skridt tilbage og se at der er en mulighed mere:

auto-import + individuelle rettelser fra OSM-miljøet > auto-import >
manuel import


Ole



Mere information om maillisten Talk-dk.