[Talk-it] Risorsa di geodati molto interessante: DBPrior 10K - strati nazionali prioritari

Daniele Forsi dforsi a gmail.com
Dom 14 Lug 2013 15:10:00 UTC


Il 06 luglio 2013 23:24, Leonardo ha scritto:

> Allora ho dato un'occhiata rapidissima al Veneto e per ora quelli che
> potrebbero interessarmi/ci come Regione sono quello degli specchi d'acqua,
> dato che ne vedo molti non presenti su OSM.
>
> Quello delle strade potrebbe essere utile ma è necessario fare un controllo
> confrontando con i dati già inseriti. A questo punto mi appellerei ai guru
> dei database presenti nella mailing list per chiedere se è possibile fare un
> controllo (anche semplice inizialmente) tra i dati degli shape rilasciati e
> i dati presenti su OSM, del tipo segnala solo le strade del file SHP con i
> nomi NON presenti su OSM e se fosse possibile creare così un file SHP senza
> le strade già inserite in OSM.

ho guardato il file del Veneto, che non è adatto per il mio solito
programma che si aspetta i dati già divisi per Comune, andrebbero
divisi, ad esempio usando i confini ISTAT perché i confini OSM sono
troppo fragili e perché per noi questi dati esterni sono statici e
darebbero una base di confronto più stabile, però una volta divisi non
è pratico gestire 500+ Comuni con lo script attuale che crea un file
per ogni pagina, dovrei riscriverlo praticamente tutto e allora magari
studierei un approccio diverso

se qualcuno ha già un'idea per come procedere, io posso scrivere
qualcosa che uniforma i nomi casi e poi passarglielo

Scrivo qui quello che ho fatto, magari qualcuno è invogliato a proseguire:

ho scaricato il file del Veneto da
http://www.centrointerregionale-gis.it/DBPrior/DBPrior1.asp

con ogrinfo ho guardato quante righe sono e se i nomi dei campi sono
comprensibili (nella pagina di download e nello zip non c'è scritto
dove si trova la descrizione del tracciato dello shapefile, magari è
spiegato tutto in
http://www.centrointerregionale-gis.it/script/Documenti_intesa.asp ma
per ora mi basta poco)

in questo modo ho visto che sono 72914 righe e che il nome è nella colonna NOME

ogrinfo -so tratti_di_strada_wgs84-32_5.shp tratti_di_strada_wgs84-32_5
[...]
Feature Count: 72914
[...]
NOME: String (100.0)
[...]

poi con ogr2ogr ho estratto un elenco i nomi per capire come sono scritti
ogr2ogr -f csv dati -sql 'SELECT DISTINCT NOME FROM
"tratti_di_strada_wgs84-32_5" ORDER BY NOME'
tratti_di_strada_wgs84-32_5.dbf

quel comando crea una cartella "dati" con dentro un solo file con
estensione .csv ordinato alfabeticamente e si trova qualche caso
particolare già tra i primi nomi:
ARGINE S. MARCO
BANCHINA DELL' AZOTO(MESTRE)
BORGO G.
CALLE DE L' ARTIGIANO(MURANO)
CALLE DE L'ARTIGIANO(MURANO)
CONTRA' CORTE SAN EUSEBIO
CONTRÀ CORTE S.EUSEBIO

poi ho cercato caratteri particolari e per fortuna sono pochi:
grep -e "[^-A-Z0-9.()' ]" dati/tratti_di_strada_wgs84-32_5.csv
PIAZZA 1^ MAGGIO
SP 19d (PD)
VIA ASTICO/LUPIA
VIA ROMA 2ø TRONCO
"VIA VITTORIO EMANUELE
VIA VITTORIO EMANUELE"

e ci sono diversi nomi del tipo ST00000029 su cui un po' di
spiegazione non farebbe male

-- 
Daniele Forsi



Maggiori informazioni sulla lista Talk-it