[Talk-dk] Manglende 'steder' i Danmark - nu på github

Michael Larsen mvl.osm at network42.dk
Søn Mar 2 15:28:24 UTC 2014


Hej,

Jeg har opdateret listen med et par nye alias'er således at adressedata med fx 
'Bj' kan matche 'Bjerge', 'Udfl.' kan matche 'Udflyttere' etc.  Jeg har desuden 
lavet et nyt kort, hvor der skal 150 punkter til at indikere et manglende 
stednavn.  Dette kort er toppen af isbjerget, men lidt lettere at overskue:

https://gist.github.com/MichaelVL/9307793

Sig til hvis I finder andre forkortelser etc. i adressedataene - automatiske 
værktøjer er ikke bedre end de data man giver dem...

MichaelVL

On Sunday, March 02, 2014 16:09:42 Kristian Krægpøth wrote:
> Hej Søren
> 
> Ja det fungerer med chrome som browser.
> Det ser ud, som om jeg har misset en del stednavne. Eller at stednavnene er
> angivet forskelligt på Michael Larsens liste og på Geodatastyrelsens
> skærmkort.
> Fx er Sønderby Bjerge syd for Assens angivet som Sønderby Bj på Michael
> Larsens liste. Og derfor optræder den som manglende.
> Hvad er nu mest korrekt af de to navne?
> 
> Vh
> Kristian Krægpøth
> 
> 
> 
> Den 2. mar. 2014 kl. 15.28 skrev Soren Johannessen <
> 
> soren.johannessen at gmail.com>:
> > Hej Kristian
> > 
> > Jeg ved ikke om du bruger Microsofts Internet Explorer browser til at
> > besøge den side Michael har sat op? Microsofts Internet Explorer har
> > det med gå i sort over de sider på Gist med kort. Chrome browser
> > skulle vise den fint uden problemer.
> > Hvis du stadigvæk har problemer, så kan jeg lave en fil så du evt. kan
> > se stednavne i Google Earth over Fyns området
> > 
> > Vedr. metode så er det da helt fint den måde du har gjort og godt set
> > med fx kvarterer i byer der kan bruges place=neighbourhood.
> > 
> > Vedr. regneark - Hvis du er færdig med en kommune(r) vedr. bydele/byer
> > osv på Fyn - Så angiv gerne i regnarket at den er gennemgået og
> > færdigtjekket, så ikke andre begynder - dumt med dobbeltarbejde.
> > 
> > vh
> > Søren Johannessen
> > 
> > 2014-03-02 15:10 GMT+01:00 Kristian Krægpøth <k.kragpoth at gmail.com>:
> > > Hej korttegnerkolleger
> > > 
> > > Jeg har prøvet at åbne linket i Michael Larsens første mail i denne
> > 
> > streng.
> > 
> > > Det fik jeg ikke noget ud af bortset fra, at skærmen gik i sort. Det
> > 
> > behøver
> > 
> > > ikke at have noget med linket at gøre - det kan udmærket have at gøre
> > > med
> > > mine manglende evner udi edb.
> > > 
> > > Men sådan som jeg har forstået det, handler denne streng om at indlægge
> > > stednavne på OSM efter Geodatastyrelsens oplysninger. Det har jeg brugt
> > 
> > en
> > 
> > > del tid på her på det sidste. Jeg har brugt Geodatastyrelsens kort fra
> > > udinaturen.dk.
> > > 
> > > Jeg har ind imellem været lidt i tvivl om, hvordan jeg skulle
> > 
> > karakterisere
> > 
> > > de forskellige bebyggelser. Jeg har anvendt place=isolated_dwelling når
> > 
> > der
> > 
> > > har været 2-3 adresser på stedet. Når der har været 3 eller flere
> > 
> > adresser
> > 
> > > på stedet, har jeg anvendt place=hamlet. Alle landsbyerne af størrelsen
> > > village var alle angivet her på Fyn.
> > > Til forstæder i byerne har jeg anvendt place=suburb. Hvor der ikke er
> > 
> > tale
> > 
> > > om forstæder, men mere om kvarterer i byerne, har jeg anvendt
> > > place=neighbourhood.
> > > Er det korrekt?
> > > 
> > > Jeg har tjekket hele Fyn undtagen Storodense.
> > > Er det så nu, at jeg kan bruge Søren Johannesens regneark? Eller er det
> > > koblet op på Michael Larsens link?
> > > 
> > > Venlig hilsen
> > > Kristian Krægpøth
> > > 
> > > 
> > > Den 1. mar. 2014 kl. 20.12 skrev Soren Johannessen
> > > 
> > > <soren.johannessen at gmail.com>:
> > >> For ikke at overlappe og lave dobbeltarbejde, så har jeg sat et Google
> > >> Regneark op - hvor du kan angive hvilken kommune du tjekker ud samt
> > >> får tilføjet nye "place" tag. Gå først ind at angiv at hvilken kommune
> > >> du arbejder i og under status skriv "i gang" - når du er færdig så gå
> > >> ind og skriv du er færdig. Regneark er her
> > 
> > https://docs.google.com/spreadsheet/ccc?key=0AtEEDDn3xy9BdEtibDF0Q0tnSGNCd
> > jh6bko4WlI4ZlE&usp=sharing#gid=0> 
> > >> vh
> > >> Søren
> > >> 
> > >> 2014-03-01 19:44 GMT+01:00 Michael Larsen <mvl.osm at network42.dk>:
> > >> > Hej,
> > >> > 
> > >> > Jeg har indsat 'Ll' som et muligt alias for 'Lille' samt filtre for
> > 
> > dine
> > 
> > >> > fire
> > >> > andre falske matches.  Sig til hvis I støder på andre forkortelser
> > 
> > eller
> > 
> > >> > forkerte matches så skal jeg opdaterer listen.
> > >> > 
> > >> > MichaelVL
> > >> > 
> > >> > On Saturday, March 01, 2014 17:21:08 Uffe Kousgaard wrote:
> > >> >> Hej,
> > >> >> 
> > >> >> Jeg har prøvet at tilføje nogle for Roskilde-Lejre-området:
> > >> >> 
> > >> >> Abbetved
> > >> >> Bjergmarken
> > >> >> Gøderup
> > >> >> Hastrup (opr. Snoldelev-Hastrup lavet om til alternativt navn)
> > >> >> Kirkerup
> > >> >> Kisserup
> > >> >> Lille Valby (stavet som Ll Valby, så den vil fortsat dukke op som
> > >> >> fejl?)
> > >> >> Nye Glim
> > >> >> Osager
> > >> >> Rye
> > >> >> Smidstrup
> > >> >> Tjæreby
> > >> >> Trællerup
> > >> >> Uglestrup
> > >> >> 
> > >> >> "Hvalsø" er ikke tilføjet, da Kirke Hvalsø allerede er med.
> > >> >> "Roskilde By" er ikke tilføjet, da Roskilde allerede er med.
> > >> >> "Skovhastrup" er tilføjet som alternativt navn for "Skov-Hastrup".
> > >> >> "Torkildstrup" er ikke tilføjet, da Torkilstrup allerede er med.
> > >> >> 
> > >> >> Ment som inspiration til andre, der vil kaste sig over at tilføje
> > >> >> stednavne.
> > >> >> Hvilke problemer, man kan støde ind i.
> > >> >> 
> > >> >> mvh
> > >> >> Uffe Kousgaard
> > >> >> 
> > >> >> Michael Larsen wrote:
> > >> >> > Hej,
> > >> >> > 
> > >> >> > Jeg har opdateret nedestående liste over steder ('places') kan kan
> > >> >> > detekteres som 'manglende' ud fra de eksisterende adressenoder. 
> > >> >> > Et
> > >> >> > kort
> > >> >> > kan ses her:
> > >> >> > 
> > >> >> > https://gist.github.com/MichaelVL/9290477
> > >> >> > 
> > >> >> > Postnummer statistik:
> > >> >> >   1xxx: 137
> > >> >> >   2xxx: 39
> > >> >> >   3xxx: 73
> > >> >> >   4xxx: 442
> > >> >> >   5xxx: 122
> > >> >> >   6xxx: 226
> > >> >> >   7xxx: 260
> > >> >> >   8xxx: 276
> > >> >> >   9xxx: 159
> > >> >> > 
> > >> >> > Total: 1734
> > >> >> > 
> > >> >> > Bortset fra København kan de fleste mangleden 'places' findes i
> > >> >> > Geodatastyrelsens Stednavne dataset med "FEAT_TYPE" lig "By" eller
> > >> >> > "Spredt
> > >> >> > bebyggelse".  Sammenlignes der med data fra Geodatastyrelsen
> > 
> > mangler
> > 
> > >> >> > der
> > >> >> > dog endnu flere stednavne i OSM datasettet.
> > >> >> > 
> > >> >> > Det kræver normalt lidt lokalkendskab at tilføje stederne, men jeg
> > >> >> > håber
> > >> >> > at
> > >> >> > denne visualisering kan hjælpe processen lidt på vej.
> > >> >> > 
> > >> >> > /MichaelVL
> > >> >> > 
> > >> >> > 
> > >> >> > --------------------------------
> > >> >> > Michael Larsen
> > >> >> > Fre Okt 5 16:29:47 BST 2012
> > >> >> > 
> > >> >> > Hej,
> > >> >> > 
> > >> >> > Jeg har lavet en analyse af manglende steder (byer etc.) baseret
> > >> >> > på
> > >> >> > eksisterende adressedata i OSM.  Under antagelsen at adressenoder
> > 
> > med
> > 
> > >> >> > følgende tags: 'osak:subdivision', 'kms:city_name', 'addr:city'
> > >> >> > beskriver
> > >> >> > et stednavn og ved at beregne en gennemsnitlig position for alle
> > >> >> > disse
> > >> >> > noder (med samme 'addr:postcode') kan man lave en liste over
> > >> >> > mulige
> > >> >> > steder og deres geografiske position.
> > >> >> > 
> > >> >> > Listen kan derefter reduceres hvis der 'tæt på' findes en node
> > 
> > eller
> > 
> > >> >> > way
> > >> >> > med et 'place' tag og et matchende 'name' tag. Med passende
> > >> >> > heuristikker
> > >> >> > for inkorrekte navne i adressedataene fåes en liste over mulige
> > >> >> > manglende
> > >> >> > stednavne i Danmark. Vedhæftede billede viser situationen omkring
> > >> >> > Ebeltoft (labels angiver navn:postnummer:antal-adresser).  Hvis
> > >> >> > der
> > >> >> > skal
> > >> >> > 100 adressepunkter til at definere et stednavn er postnummer
> > >> >> > statistikken
> > >> >> > for>
> > >> >> > 
> > >> >> > manglende stednavne:
> > >> >> >   1xxx: 17
> > >> >> >   2xxx: 25
> > >> >> >   3xxx: 52
> > >> >> >   4xxx: 189
> > >> >> >   5xxx: 67
> > >> >> >   6xxx: 80
> > >> >> >   7xxx: 97
> > >> >> >   8xxx: 113
> > >> >> >   9xxx: 41
> > >> >> > 
> > >> >> > Total: 681
> > >> >> > 
> > >> >> > og tilsvarende med 30 adressepunkter:
> > >> >> >   1xxx: 136
> > >> >> >   2xxx: 39
> > >> >> >   3xxx: 90
> > >> >> >   4xxx: 519
> > >> >> >   5xxx: 224
> > >> >> >   6xxx: 251
> > >> >> >   7xxx: 280
> > >> >> >   8xxx: 295
> > >> >> >   9xxx: 167
> > >> >> > 
> > >> >> > Total: 2001
> > >> >> > 
> > >> >> > Mine heuristikker for navnematching kan selvfølgelig være
> > 
> > mangelfulde
> > 
> > >> >> > men
> > >> >> > der er helt sikkert også fejl i adressedataene, hvilket leder frem
> > >> >> > til
> > >> >> > 
> > >> >> > 1. Ligesom vi har lavet et system for rettelser af vejnavne kunne
> > 
> > vi
> > 
> > >> >> > også
> > >> >> > have det for de nævnte stednavne.  Fx findes der en by i
> > 
> > Nordjylland
> > 
> > >> >> > som
> > >> >> > adressedataene kalder 'Lyngby', men byen hedder faktisk 'Nørre
> > >> >> > Lyngby'.
> > >> >> > Tilsvarende er der adressedata som skriver 'Vrå By' for at
> > >> >> > indikere
> > >> >> > at
> > >> >> > punkterne ligger i byen Vrå og ikke i oplandet, men byen hedder
> > 
> > altså
> > 
> > >> >> > kun
> > >> >> > Vrå.
> > >> >> > 
> > >> >> > 2. Vi mangler en hel del danske stednavne i OSM.  Jeg har
> > >> >> > 'mangellisten'
> > >> >> > tilgængelig som GPX fil som er lige til at loade i fx. josm og med
> > >> >> > lidt
> > >> >> > lokalkendskab er det hurtigt at tilføje de manglende navne. Jeg
> > 
> > kunne
> > 
> > >> >> > poste
> > >> >> > filen her på listen, men måske er der nogen som har forslag til
> > >> >> > hvorledes
> > >> >> > det gøres mere praktisk mht. opdateringer etc.  Analysen foretages
> > 
> > af
> > 
> > >> >> > et
> > >> >> > lille osmium baseret c++ program og tager kun sekunder at køre for
> > >> >> > hele
> > >> >> > DK, men data bør opdateres fx. dagligt.
> > >> >> > 
> > >> >> > Bemærk også at listen indeholder byer som er makeret med
> > 
> > 'residental'
> > 
> > >> >> > og
> > >> >> > 'name' man mangler 'place' (fx Feldballe).
> > >> >> > 
> > >> >> > MichaelVL
> > >> >> > 
> > >> >> > _______________________________________________
> > >> >> > Talk-dk mailing list
> > >> >> > Talk-dk at openstreetmap.org
> > >> >> > https://lists.openstreetmap.org/listinfo/talk-dk
> > >> >> 
> > >> >> _______________________________________________
> > >> >> Talk-dk mailing list
> > >> >> Talk-dk at openstreetmap.org
> > >> >> https://lists.openstreetmap.org/listinfo/talk-dk
> > >> > 
> > >> > _______________________________________________
> > >> > Talk-dk mailing list
> > >> > Talk-dk at openstreetmap.org
> > >> > https://lists.openstreetmap.org/listinfo/talk-dk
> > >> 
> > >> _______________________________________________
> > >> Talk-dk mailing list
> > >> Talk-dk at openstreetmap.org
> > >> https://lists.openstreetmap.org/listinfo/talk-dk
> > > 
> > > _______________________________________________
> > > Talk-dk mailing list
> > > Talk-dk at openstreetmap.org
> > > https://lists.openstreetmap.org/listinfo/talk-dk
> > 
> > _______________________________________________
> > Talk-dk mailing list
> > Talk-dk at openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-dk




Mere information om maillisten Talk-dk.