[Talk-dk] Lidt statistik

Jonas Häggqvist rasher at rasher.dk
Søn Feb 27 22:19:41 GMT 2011


On 27-02-2011 21:19, Jens Winbladh wrote:
> Her tænkt lidt mere statistisk over dine fine tal.
>
> Når man reducere afstanden mellem adressen og navngiven vej, så fortæller
> det en noget om du er i by eller på landet. Altså om afstanden far
> adressen og vejen. Dvs. I byen vil du næste altid ramme 100%, da
> adresserne ligger helt tæt ved den adressegivne vej. Hvorimod på landet
> vil man altid ligge lavt (hvilket kan ses på hvor kraftigt faldet er
> mellem 500, 250 og 100m), da adresserne altid ligger langt fra den
> adressegivne vej.
>
> Derfor foreslår jeg om du ikke kan lave en kolonne med postnummer, hvor
> der gives en procent sats for forholdet mellem totale antallet af adresser
> i et postnummer og adresser med en korrekt navngivne vej tilknyttet.
> Altså uden nogen afstand.
> -giver det mening.

Jeg kan ikke lave en procentsats helt uden hensyntagen til afstand, idet 
jeg så ville få fejlagtige vej-matches helt andre steder i landet (med 
mindre vi begyndte at tagge post-nummeret på vejene). Hvis ikke det er det 
du mener, så må du vist forklare lidt bedre?

Som Rasmus skriver smider jeg antallet af adresse-punkter på fra nu af.

> Hvordan får du den genereret?

Koden der genererer den er på http://osm.rasher.dk/pub/stats.sh - hvis du 
er ude efter en mere højniveau-forklaring er her et forsøg:

For hvert eneste adresse-punkt slår jeg op om der findes en vej med 
tilsvarende name indenfor X meter. Gør der der giver det værdien 1 - hvis 
ikke giver det værdien 0. Til slut grupperer jeg resultatet efter 
postnummer (eller postnummerserie) og tager gennemsnitsværdien af den 
værdi (1 eller 0 pr punkt).

-- 
Jonas Häggqvist
rasher(at)rasher(dot)dk



Mere information om maillisten Talk-dk.