[Talk-dk] Manglende 'steder' i Danmark

Michael Larsen mvl.osm at network42.dk
Fre Okt 5 16:29:47 BST 2012


Hej,

Jeg har lavet en analyse af manglende steder (byer etc.) baseret på 
eksisterende adressedata i OSM.  Under antagelsen at adressenoder med følgende 
tags: 'osak:subdivision', 'kms:city_name', 'addr:city' beskriver et stednavn 
og ved at beregne en gennemsnitlig position for alle disse noder (med samme 
'addr:postcode') kan man lave en liste over mulige steder og deres geografiske 
position.

Listen kan derefter reduceres hvis der 'tæt på' findes en node eller way med 
et 'place' tag og et matchende 'name' tag. Med passende heuristikker for 
inkorrekte navne i adressedataene fåes en liste over mulige manglende 
stednavne i Danmark. Vedhæftede billede viser situationen omkring Ebeltoft 
(labels angiver navn:postnummer:antal-adresser).  Hvis der skal 100 
adressepunkter til at definere et stednavn er postnummer statistikken for 
manglende stednavne:

  1xxx: 17
  2xxx: 25
  3xxx: 52
  4xxx: 189
  5xxx: 67
  6xxx: 80
  7xxx: 97
  8xxx: 113
  9xxx: 41
Total: 681

og tilsvarende med 30 adressepunkter:

  1xxx: 136
  2xxx: 39
  3xxx: 90
  4xxx: 519
  5xxx: 224
  6xxx: 251
  7xxx: 280
  8xxx: 295
  9xxx: 167
Total: 2001

Mine heuristikker for navnematching kan selvfølgelig være mangelfulde men der 
er helt sikkert også fejl i adressedataene, hvilket leder frem til

1. Ligesom vi har lavet et system for rettelser af vejnavne kunne vi også have 
det for de nævnte stednavne.  Fx findes der en by i Nordjylland som 
adressedataene kalder 'Lyngby', men byen hedder faktisk 'Nørre Lyngby'.  
Tilsvarende er der adressedata som skriver 'Vrå By' for at indikere at 
punkterne ligger i byen Vrå og ikke i oplandet, men byen hedder altså kun Vrå.

2. Vi mangler en hel del danske stednavne i OSM.  Jeg har 'mangellisten' 
tilgængelig som GPX fil som er lige til at loade i fx. josm og med lidt 
lokalkendskab er det hurtigt at tilføje de manglende navne. Jeg kunne poste 
filen her på listen, men måske er der nogen som har forslag til hvorledes det 
gøres mere praktisk mht. opdateringer etc.  Analysen foretages af et lille 
osmium baseret c++ program og tager kun sekunder at køre for hele DK, men data 
bør opdateres fx. dagligt.

Bemærk også at listen indeholder byer som er makeret med 'residental' og 
'name' man mangler 'place' (fx Feldballe).

MichaelVL
-------------- næste del --------------
En vedhæftet fil der ikke var tekst, er blevet fjernet...
Navn: missing_places.png
Type: image/png
Størrelse: 139999 bytes
Beskrivelse: ikke tilgængelig
URL: <http://lists.openstreetmap.org/pipermail/talk-dk/attachments/20121005/832f51e0/attachment-0001.png>


Mere information om maillisten Talk-dk.