[OSM-talk-be] import AGIV CRAB-data

Thomas osm at aptum.nl
Tue Oct 21 18:28:17 UTC 2014


In de discussie over node vs gebouw kan ik zeker meegaan in wat Sander 
zegt. Bij nader inzien hoeft een combinatie van beide geen probleem te 
zijn. Wat mij betreft kunnen in dat opzicht ook zeker adresposities 
geimporteerd worden zonder dat daar gelijk een gebouw-polygoon voor moet 
ingetekend zijn. Dat de CRAB-positie in veel gevallen het 
perceel-centroid is en daarmee niet wenselijk als adrespositie binnen 
OSM klopt ook. Binnen de workflow kan dan opgenomen worden dat de 
adresposities minimaal op de AGIV-luchtfoto op het gebouw moeten komen 
te staat dat het dichtst aan de weg ligt. Hoewel dat toch zeer wenselijk 
is als uiteindelijk doel denk ik dat het 'eisen' dat er een 
gebouw-polygoon aanwezig moet zijn toch veel mensen afschrikt om mee te 
werken aan de import. Nu wordt in de wiki ook al aangegeven dat het zeer 
wenselijk is om gelijk ook de gebouw-polygonen te tracen van de 
luchtfoto. De verwoording in de wiki lijkt mij wat dat betreft prima.

Voor een aantal woonwijken zal het erop neer komen dat 'alle' 
adresposities binnen CRAB prima op het gebouw vallen en daarmee 
rechtstreeks geimporteerd kunnen worden (uiteraard na handmatige 
controle van elke individuele node). Voor heel veel landelijke gebieden 
zal dan de adrespositie handmatig verschoven moeten worden (met de 
luchtfoto als leidraad) tot boven het gebouw dat het dichtst aan de 
straat ligt. In de workflow moet dan even duidelijk vermeld worden dat 
het gebruiken van de AGIV-GRB-kaart heel handig is om zaken mee te 
vergelijken, maar dat de adresposities niet op de GRB-kaart mogen worden 
uitgelijnd en dat ook de gebouw-contouren niet mogen worden overgenomen 
van die kaart. Wanneer er een bestaande polygoon is voor dat adres 
kunnen de gegevens uit het CRAB daar aan toegevoegd worden. Daarnaast 
bestaat dan uiteraard altijd de mogelijkheid om het gebouw gelijk in te 
tekenen.

Op technisch gebied gaat het volgens mij best goed. Ik wil zeker mee 
kijken naar de software zelf; als de scripts beschikbaar kunnen worden 
gesteld: graag! De laatste variant van de webpagina werkt bij mij prima. 
Nog iets om bij stil te staan: nog los van waar de punten zonder positie 
geplaatst worden bij import (middelpunt van de straat?); nu worden ze op 
elkaar weergegeven. Misschien kan daar met een offset gewerkt worden of 
zo, zodat visueel al bij import duidelijk is dat er meerdere punten op 
elkaar liggen. Alternatief is dat zo'n punt op het dichtste punt langs 
de straat wordt geplaatst, maar die gegevens heb je volgens mij niet 
beschikbaar in het import-script. Nog een alternatief is dat de punten 
precies verticaal boven/onder elkaar worden geplaatst langs de 
westelijke of oostelijke rand van de extent, ter hoogte van een 
overeenkomstig punt (als query een gelijk numeriek gedeelte in het 
nummer-veld). Maar misschien vinden jullie het helemaal geen issue dat 
er meerdere punten op elkaar liggen bij import.

Over het niet uitvoeren van een grootschalige import zijn we het denk ik 
allemaal eens. Ook is het duidelijk dat er specifieke richtlijnen moeten 
zijn (of in elk geval een plan van aanpak) voor een aantal specifieke 
issues met de brondata, zoals de aanwezigheid van adressen zonder 
positie. Daarnaast heb ik het idee dat het geheel op de import-lijst 
voor een gedeelte is afgeketst door het niet formeel beschreven zijn van 
de quality-assesment van de brondata, een eisenspecificatie van de 
software en het plan voor het beheren van updates in de toekomst.

Als ik het zo bekijk is het meeste toch minstens gedeeltelijk besproken. 
Ik denk dat als we dat wat formeler op een rij zetten, we ook een betere 
'case' hebben voor de import-lijst. In elk geval is dan voor externen 
beter te beoordelen wat nu juist de bedoeling is.

Ook voor de software is het denk ik handig om een concrete lijst van 
eisen te hebben zodat verschillende software-opties tegen elkaar 
afgewogen kunnen worden. Er zijn meerdere softwarematige opties mogelijk 
maar we hebben geen formele manier om ze te vergelijken en te beoordelen 
welke de 'beste' is. Bij de vorige gang naar de import-lijst kwamen er 
vragen over het waarom niet gebruik maken van de task-manager en zo. 
Door concreet een lijst van eisen te hanteren kan heel duidelijk gemaakt 
worden waarom die software niet voldoet en waarom alternatieve software 
daar beter voor geschikt is (in dit geval lijkt het belangrijkste punt 
mij het per-straat kunnen werken in plaats van per oppervlakte-polygoon).

Concreet moeten er denk ik 4 formele lijstjes van 
voorwaarden/richtlijnen/plannen opgesteld worden:
1) Kwaliteitsbeoordeling van de brondata: welke data is het, welke 
kenmerken heeft de data en hoe kan de kwaliteit beoordeeld worden.
2) Kwaliteitsbeoordeling en 'normering' voor de import-software: wat 
moet de software precies wel en niet doen en hoe wordt de werking 
daarvan beoordeeld.
3) Richtlijnen voor de menselijke handelingen bij de import: workflow. 
De wiki-pagina geeft hier al heel wat aanwijzingen maar is niet compleet.
4) Heel belangrijk: plan van aanpak voor het continu updaten van de 
gegevens.

Deze formele lijsten kunnen bij de import-aanvraag gevoegd worden als 
onderbouwing, mogelijk als wiki-pagina over de import op zich. Verder 
kan de inhoud ervan volgens mij best verwerkt worden op de (bestaande) 
wiki-pagina's. Ik denk dat het belangrijk is dat deze lijsten opgesteld 
worden. Het zou toch erg jammer zijn als het voorstel op de import-lijst 
afketst omdat bepaalde zaken niet voldoende uitgewerkt zijn. Dat zou ook 
heel erg jammer zijn voor de vele inspanningen die al geleverd zijn.

Als jullie het hiermee eens zijn ben ik zeker bereid om deze lijsten 
vorm te gaan geven. Voor de eerste lijst moet ik me nog wat verdiepen in 
de formele beschrijving van de dataset; daar kom ik op terug. Voor de 
andere drie lijsten gelijk een voorzet:

1) Kwaliteit van de brondata. Specifieke issues:
     – adressen zonder positie
     – verkeerde spelling
2) Eisen voor het import-script:
     a) Oplossing voor alle specifieke issues met de brondata?
     b) Wat wel/niet te importeren (naast specifieke issues)?
         Beoordeling van volledigheid van import-script?
         vb:  Vakbondstraat in Willebroek ontbrekende nrs tussen 9 en 41
     c) Welke tags worden mee geimporteerd? (zie ook 3.d relaties en 4.a)
     d) Het systeem moet het mogelijk maken een latere update te beheren
3) Richtlijnen voor de workflow:
     a) Gegevens worden geimporteerd met het script
     b) Adrespunten worden verplaatst tot boven het gebouw 
(AGIV-luchtopname)?
         Is hier consensus over? Wat met het issue uit mijn vorige 
bericht aan Marc?
     c) Gegevens uit adrespunt worden toegevoegd aan gebouw-polygoon.
         – indien polygoon aanwezig en eenduidig voor adres: adrespunt 
wordt verwijderd
         – indien polygoon aanwezig maar niet eenduidig
             vb: meerdere adressen in 1 gebouw: appartement, 
winkelcentrum, etc
             → adrespunt op zichzelf laten bestaan.
             → Waar precies? Ingang/centroide? (zie ook punt b)
             → Hoe adrespunten die precies boven elkaar liggen te 
behandelen?
             → POI-tags komen dan niet op polygoon maar op het punt te 
staan.
                 Wanneer POI volledige polygoon bestrijkt: tags op 
polygoon laten.
         –  indien polygoon niet aanwezig:
             * Bij voorkeur gebouw intekenen
             * Indien niet haalbaar: adrespunt op zichzelf laten bestaan
             * Indien gebouw niet duidelijk aanwijsbaar of afwezig: niet 
importeren
     d) Richtlijnen voor straatgegevens op gebouw, punt of als relatie?
     e) Richtlijn voor dedicated account?
     f) Registratie voortgang import: overzicht? kaart?
4) Plan van aanpak voor het up to date houden:
     a) bron-tags (zoals CRAB-id) bij import handhaven tbv latere update?
     b) diffs-worden automatisch gegenereerd
     c) Hoe weten gebruikers wat geupdate moet worden? overzicht?

Deze lijsten lijken mij het best te passen binnen 
http://wiki.openstreetmap.org/wiki/AGIV_CRAB_Import . De inhoud moet dan 
verder verwerkt worden in 
http://wiki.openstreetmap.org/wiki/WikiProject_Belgium/Using_AGIV_Crab_data 
en de daaraan gekoppelde subpagina's.

De richtlijnen voor huisnummers en zo kunnen dan gekoppeld worden aan of 
verwerkt worden in
http://wiki.openstreetmap.org/wiki/User:Escada/JOSM_and_Housenumbers


Wat denken jullie over het wat formeel op een rij zetten van de 
hierboven genoemde zaken? Hebben jullie ideeën voor een verdere concrete 
invulling hiervan?

Groeten,
Thomas

Sander Deryckere schreef op 20-10-2014 22:34:
> Eindelijk een versie die werkt met JOSM remotecontrol (na een JOSM 
> patch, dus werkt het enkel met de SVN versie).
>
> http://sanderd17.github.io/import.html?8840
>
> Nu ben ik nog van plan een afstands-check toe te voegen (met 
> instelbare afstand), en dan kan het terug naar de import lijst.
>
> We moeten enkel nog wat richtlijnen bedenken mbt huisnummers zonder 
> positie, en met de richtlijnen over waar een huisnummer te plaatsen 
> (node, gebouw, waar exact) moet alles in orde zijn.
>
> Groeten,
> Sander
>
> Op 18 oktober 2014 17:46 schreef Marc Gemis <marc.gemis at gmail.com 
> <mailto:marc.gemis at gmail.com>>:
>
>
>     2014-10-17 23:27 GMT+02:00 Thomas <osm at aptum.nl
>     <mailto:osm at aptum.nl>>:
>
>         Daar waar gebouw-polygonen beschikbaar zijn, zijn ze vaak
>         ingetekend op basis van een luchtfoto (die op die schaal toch
>         een aanzienlijke vertekening heeft). In vrijwel alle gevallen
>         die ik bekeken heb is het CRAB-adrespunt nauwkeuriger
>         gepositioneerd dan de polygoon die in OSM aanwezig is.
>
>
>     Dit begrijp ik niet helemaal. Bedoel je dat de polygoon in OSM
>     helemaal niet rond het adres punt is getekend ?
>     Voor het overige plaatst de standard rendering van OSM het
>     huisnummer gewoon in het midden van de polygoon (als de gegevens
>     op de polygoon staan).
>     Sommige mensen plaatsen het huisnummer ongeveer op de deur, dus op
>     de rand van het gebouw, of gewoon ergens in het gebouw. Er is geen
>     regel waar het adrespunt moet komen. In Denemarken zijn ze er wel
>     strenger op waar de huisnummers moet komen (alvast niet op het
>     gebouw, dat is het enige dat ik kan onthouden :-) )
>     Dus als er geen regels zijn, kan je IMHO ook niet spreken over
>     "nauwkeuriger gepositioneerd", als het nummer op/in het juiste
>     huis staat, is het juist gepositioneerd voor OSM. Nauwkeuriger kan
>     niet :-)
>
>     met vriendelijke groeten
>
>     m
>
>
>     _______________________________________________
>     Talk-be mailing list
>     Talk-be at openstreetmap.org <mailto:Talk-be at openstreetmap.org>
>     https://lists.openstreetmap.org/listinfo/talk-be
>
>
>
>
> _______________________________________________
> Talk-be mailing list
> Talk-be at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-be

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.openstreetmap.org/pipermail/talk-be/attachments/20141021/8a604cb3/attachment.htm>


More information about the Talk-be mailing list