[Talk-dk] Lidt statistik
Jonas Häggqvist
rasher at rasher.dk
Søn Feb 27 22:19:41 GMT 2011
On 27-02-2011 21:19, Jens Winbladh wrote:
> Her tænkt lidt mere statistisk over dine fine tal.
>
> Når man reducere afstanden mellem adressen og navngiven vej, så fortæller
> det en noget om du er i by eller på landet. Altså om afstanden far
> adressen og vejen. Dvs. I byen vil du næste altid ramme 100%, da
> adresserne ligger helt tæt ved den adressegivne vej. Hvorimod på landet
> vil man altid ligge lavt (hvilket kan ses på hvor kraftigt faldet er
> mellem 500, 250 og 100m), da adresserne altid ligger langt fra den
> adressegivne vej.
>
> Derfor foreslår jeg om du ikke kan lave en kolonne med postnummer, hvor
> der gives en procent sats for forholdet mellem totale antallet af adresser
> i et postnummer og adresser med en korrekt navngivne vej tilknyttet.
> Altså uden nogen afstand.
> -giver det mening.
Jeg kan ikke lave en procentsats helt uden hensyntagen til afstand, idet
jeg så ville få fejlagtige vej-matches helt andre steder i landet (med
mindre vi begyndte at tagge post-nummeret på vejene). Hvis ikke det er det
du mener, så må du vist forklare lidt bedre?
Som Rasmus skriver smider jeg antallet af adresse-punkter på fra nu af.
> Hvordan får du den genereret?
Koden der genererer den er på http://osm.rasher.dk/pub/stats.sh - hvis du
er ude efter en mere højniveau-forklaring er her et forsøg:
For hvert eneste adresse-punkt slår jeg op om der findes en vej med
tilsvarende name indenfor X meter. Gør der der giver det værdien 1 - hvis
ikke giver det værdien 0. Til slut grupperer jeg resultatet efter
postnummer (eller postnummerserie) og tager gennemsnitsværdien af den
værdi (1 eller 0 pr punkt).
--
Jonas Häggqvist
rasher(at)rasher(dot)dk
Mere information om maillisten Talk-dk.