[Talk-dk] Manglende 'steder' i Danmark
Michael Larsen
mvl.osm at network42.dk
Fre Okt 5 16:29:47 BST 2012
Hej,
Jeg har lavet en analyse af manglende steder (byer etc.) baseret på
eksisterende adressedata i OSM. Under antagelsen at adressenoder med følgende
tags: 'osak:subdivision', 'kms:city_name', 'addr:city' beskriver et stednavn
og ved at beregne en gennemsnitlig position for alle disse noder (med samme
'addr:postcode') kan man lave en liste over mulige steder og deres geografiske
position.
Listen kan derefter reduceres hvis der 'tæt på' findes en node eller way med
et 'place' tag og et matchende 'name' tag. Med passende heuristikker for
inkorrekte navne i adressedataene fåes en liste over mulige manglende
stednavne i Danmark. Vedhæftede billede viser situationen omkring Ebeltoft
(labels angiver navn:postnummer:antal-adresser). Hvis der skal 100
adressepunkter til at definere et stednavn er postnummer statistikken for
manglende stednavne:
1xxx: 17
2xxx: 25
3xxx: 52
4xxx: 189
5xxx: 67
6xxx: 80
7xxx: 97
8xxx: 113
9xxx: 41
Total: 681
og tilsvarende med 30 adressepunkter:
1xxx: 136
2xxx: 39
3xxx: 90
4xxx: 519
5xxx: 224
6xxx: 251
7xxx: 280
8xxx: 295
9xxx: 167
Total: 2001
Mine heuristikker for navnematching kan selvfølgelig være mangelfulde men der
er helt sikkert også fejl i adressedataene, hvilket leder frem til
1. Ligesom vi har lavet et system for rettelser af vejnavne kunne vi også have
det for de nævnte stednavne. Fx findes der en by i Nordjylland som
adressedataene kalder 'Lyngby', men byen hedder faktisk 'Nørre Lyngby'.
Tilsvarende er der adressedata som skriver 'Vrå By' for at indikere at
punkterne ligger i byen Vrå og ikke i oplandet, men byen hedder altså kun Vrå.
2. Vi mangler en hel del danske stednavne i OSM. Jeg har 'mangellisten'
tilgængelig som GPX fil som er lige til at loade i fx. josm og med lidt
lokalkendskab er det hurtigt at tilføje de manglende navne. Jeg kunne poste
filen her på listen, men måske er der nogen som har forslag til hvorledes det
gøres mere praktisk mht. opdateringer etc. Analysen foretages af et lille
osmium baseret c++ program og tager kun sekunder at køre for hele DK, men data
bør opdateres fx. dagligt.
Bemærk også at listen indeholder byer som er makeret med 'residental' og
'name' man mangler 'place' (fx Feldballe).
MichaelVL
-------------- næste del --------------
En vedhæftet fil der ikke var tekst, er blevet fjernet...
Navn: missing_places.png
Type: image/png
Størrelse: 139999 bytes
Beskrivelse: ikke tilgængelig
URL: <http://lists.openstreetmap.org/pipermail/talk-dk/attachments/20121005/832f51e0/attachment-0001.png>
Mere information om maillisten Talk-dk.