[Talk-it] Statistiche interessanti OSM?

Maurizio Napolitano napoogle a gmail.com
Ven 13 Nov 2015 09:30:12 UTC


2015-11-12 12:47 GMT+01:00 Federico Leva (Nemo) <nemowiki at gmail.com>:
> Grazie, dunque ho segnato tre ipotesi che suonano fattibili piú due idee da
> indagare:
> * Incremento dei
> [https://github.com/napo/osm_users_stats_italian_province/blob/master/20150911_osm_users_stats_province_italiane.csv

Considera che quel calcolo è sulla base delle città capoluogo di provincia.
Per avere le provincie bisogna prima tagliarsi le fette dei dati per province,
oppure fare query spaziali all'interno dei confini provinciali
(tra l'altro potrei sostituire lo script con chiamate ad overpass-api)

> contributori mensili per provincia] nelle province dove WMI ha agito:

Cosa intendi "dove WMI ha agito" ?
Nel senso post potenziali eventi organizzati da WMI?


> * Aumento delle visite alla mappa principale secondo i
> [http://planet.osm.org/tile_logs/ registri tilserver] nelle province in
> questione?

Quello può essere un indicatore per sapere cosa viene visitato più
spesso in Italia.
Da li si potrebbe calcolare una correlazione fra visite e modifiche



> * Totale [http://osmstats.neis-one.org/?item=countries&country=Italy
> contributi in Italia]
> ([http://resultmaps.neis-one.org/oooc?zoom=9&lat=45.31408&lon=9.86942&layers=B00TFFFFFT
> vedi distribuzione])??

di quel tool c'è anche il paper
http://www.mdpi.com/2220-9964/1/2/146

>  [http://taginfo.openstreetmap.org/ Taginfo
> italiano]??

Secondo me sarebbe utile per capire quali tag in Italia vengono
raccolti oltre a quelli
"standard" (es. name e highway)


> Sullo storico hai ragione, è un fattore molto importante. Non sono sicuro di
> capire però: non è possibile scaricare un dump in cui ci sia tutto lo
> storico?

Certo
http://planet.openstreetmap.org/planet/full-history/

tra l'altro ci sarebbe questo
http://www.mdpi.com/2220-9964/1/3/315
che individua i vandalismi


> Avvengono delle cancellazioni che eliminano totalmente la
> cronologia dai dump? Se sí questo sarebbe simile a ciò che alcuni chiamano
> il "deletion drift" di numeri come
> https://stats.wikimedia.org/IT/TablesWikipediaIT.htm : oggi dice che ci sono
> stati 345 nuovi contributori a settembre, ma il mese prossimo saranno meno
> perché alcune delle loro voci saranno cancellate nel frattempo; i numeri
> vengono riaggiornati sempre da zero perché presumibilmente i contributi
> cancellati non avevano valore.

Le voci non vengono cancellate ma sovrascritte
Mi spiego:
un utente fa un edit su un oggetto, poi un altro lo modifica, a quel punto -
nella situazione dei dati attuali - quell'oggetto compare essere
dell'ultimo utente
Quindi, se oggi una persona ha contributito con n modifiche, ma su quelle n
è intervenuta un altra, allora la prima sembra "sparire" dalle statistiche

Su come è fatto il file dello storico di osm fra pregi e virtù qui trovi una
bella presentazione
http://www.slideshare.net/mvexel/dealing-with-historical-data-in-openstreetmap


> Diego Guidotti è ancora in giro,

è iscritto a questa ML

> può essere convinto ad aggiornare i dati e
> come? Il codice che hai messo in GitHub è davvero l'ultimo prodotto? Il sito
> non è al momento archiviato da Wayback machine e ciò è un grosso peccato
> specie se è l'unico storico disponibile per i dati vecchi: qualcuno può dire
> a gfoss di aggiungere in http://www.gfoss.it/robots.txt due righe:
>         User-agent: ia_archiver
>         Allow: /osm/stat/
> ?
>
> Per la questione del consumo di dati OSM farò qualche altra ricerca.

Google Scholar is your friend



Maggiori informazioni sulla lista Talk-it