[Talk-it] Alcuni articoli Wikipedia mappabili in OSM

Cristian Consonni kikkocristian a gmail.com
Gio 7 Nov 2013 01:37:44 UTC


Ciao Simone (F.),

ti ho mandato a questa pull request:
https://github.com/simone-f/wikipedia-tags-in-osm/pull/1

Che aggiunge un sistema di inferenza delle coordinate dalle voci di
Wikipedia (basato su una analisi dell'abstract).
Questo poi altro non è che "le cose su cui [Cristian] sta lavorando"
che Maurizio diceva all'inizio di questo thread e che ho presentato a
State of the Map [0].

Il risultato è che c'è qualche icona JOSM in più (nel momento in cui
scrivo 571 in più, ma sto generando il file), si veda un esempio qui:
http://img18.imageshack.us/img18/3734/igzv.png

Gli articoli da scansionare sono questi:
* articles_to_scan.txt 6.0 MB [1]
questo file si genera lanciando lo script con l'opzione "-c" ovvero
"--show_link_to_wikipedia_coordinates"

e questi sono invece quelli con le coordinate ricavate:
* nuts4nuts_it_coords.txt 41 KB [2]
questo file si può generare anche separatamente lanciando:
python nuts4nuts_infer.py
per altro lo script è pure interrompibile quindi si possono generare
le coordinate "un po' alla volta"[*].

Ovviamente ci mette un bel po' a ricavarele coordinate perché deve
chiamare due servizi esterni: http://nuts4nutsrecon.spaziodati.eu/ e
poi http://www.geonames.org/export/web-services.html

Una miglioria sarebbe quella di fare restituire direttamente a
http://nuts4nutsrecon.spaziodati.eu/ anche le coordinate (e non solo
il nome del comune) in modo da evitare la seconda chiamata a geonames.

Ciao,

C

[0] http://www.slideshare.net/CristianCantoro
[1] https://mega.co.nz/#!LckgTIjC!LGBqF0t6oHxq441yM3uD6RphN8wwpyVgSh1Dw0xo8Nk
[2] https://mega.co.nz/#!GIEQTZQb!fz9sCC9xlzkZZX5hI7qkAFQCZxUrotWaA1MipRp4zQw
[*] quando si interrompe lo script (con Ctrl+C) tira un errore perché
non trova un file temporaneo, non è un grosso problema, ma lo trovo
fastidioso. Se qualcuno è esperto del modulo multiprocessing di python
<docs.python.org/2/library/multiprocessing.html> mi faccia un fischio



Maggiori informazioni sulla lista Talk-it