[Talk-dk] Manglende 'steder' i Danmark - nu på github

Michael Larsen mvl.osm at network42.dk
Lør Mar 1 14:34:31 UTC 2014


Hej,

Jeg har opdateret nedestående liste over steder ('places') kan kan detekteres 
som 'manglende' ud fra de eksisterende adressenoder. Et kort kan ses her:

https://gist.github.com/MichaelVL/9290477

Postnummer statistik:

 1xxx: 137
 2xxx: 39
 3xxx: 73
 4xxx: 442
 5xxx: 122
 6xxx: 226
 7xxx: 260
 8xxx: 276
 9xxx: 159
Total: 1734

Bortset fra København kan de fleste mangleden 'places' findes i 
Geodatastyrelsens Stednavne dataset med "FEAT_TYPE" lig "By" eller "Spredt 
bebyggelse". Sammenlignes der med data fra Geodatastyrelsen mangler der dog 
endnu flere stednavne i OSM datasettet. 

Det kræver normalt lidt lokalkendskab at tilføje stederne, men jeg håber at 
denne visualisering kan hjælpe processen lidt på vej.

/MichaelVL


--------------------------------
Michael Larsen
Fre Okt 5 16:29:47 BST 2012

Hej,

Jeg har lavet en analyse af manglende steder (byer etc.) baseret på 
eksisterende adressedata i OSM. Under antagelsen at adressenoder med følgende 
tags: 'osak:subdivision', 'kms:city_name', 'addr:city' beskriver et stednavn 
og ved at beregne en gennemsnitlig position for alle disse noder (med samme 
'addr:postcode') kan man lave en liste over mulige steder og deres geografiske 
position.

Listen kan derefter reduceres hvis der 'tæt på' findes en node eller way med 
et 'place' tag og et matchende 'name' tag. Med passende heuristikker for 
inkorrekte navne i adressedataene fåes en liste over mulige manglende 
stednavne i Danmark. Vedhæftede billede viser situationen omkring Ebeltoft 
(labels angiver navn:postnummer:antal-adresser). Hvis der skal 100 
adressepunkter til at definere et stednavn er postnummer statistikken for 
manglende stednavne:

 1xxx: 17
 2xxx: 25
 3xxx: 52
 4xxx: 189
 5xxx: 67
 6xxx: 80
 7xxx: 97
 8xxx: 113
 9xxx: 41
Total: 681

og tilsvarende med 30 adressepunkter:

 1xxx: 136
 2xxx: 39
 3xxx: 90
 4xxx: 519
 5xxx: 224
 6xxx: 251
 7xxx: 280
 8xxx: 295
 9xxx: 167
Total: 2001

Mine heuristikker for navnematching kan selvfølgelig være mangelfulde men der 
er helt sikkert også fejl i adressedataene, hvilket leder frem til

1. Ligesom vi har lavet et system for rettelser af vejnavne kunne vi også have 
det for de nævnte stednavne. Fx findes der en by i Nordjylland som 
adressedataene kalder 'Lyngby', men byen hedder faktisk 'Nørre Lyngby'. 
Tilsvarende er der adressedata som skriver 'Vrå By' for at indikere at 
punkterne ligger i byen Vrå og ikke i oplandet, men byen hedder altså kun Vrå.

2. Vi mangler en hel del danske stednavne i OSM. Jeg har 'mangellisten' 
tilgængelig som GPX fil som er lige til at loade i fx. josm og med lidt 
lokalkendskab er det hurtigt at tilføje de manglende navne. Jeg kunne poste 
filen her på listen, men måske er der nogen som har forslag til hvorledes det 
gøres mere praktisk mht. opdateringer etc. Analysen foretages af et lille 
osmium baseret c++ program og tager kun sekunder at køre for hele DK, men data 
bør opdateres fx. dagligt.

Bemærk også at listen indeholder byer som er makeret med 'residental' og 
'name' man mangler 'place' (fx Feldballe).

MichaelVLMere information om maillisten Talk-dk.