<div dir="ltr">Io invece vorrei segnalare un fatto curioso.<div><br></div><div><div>La struttura dei dati dello shapefile R19_WGS84 (regione Sicilia) č diversa da tutte le altre ed, ovviamente, dalla descrizione dei dati che hanno pubblicato.</div>
<div><br></div><div>Oltre a cambiare i nomi dei campi:</div><div>TIPO_LOC -----> TIPO_LOC_N</div><div>COD_LOC -----> LOC</div><div>ACE -------------> COM_ACE</div><div><br></div><div>mi manca il campo COD_ASC che dovrebbe identificare univocamente l'area subcomunale in ambito comunale.</div>
<div>In compenso esistono due campi non documentati:</div><div>COD_TIPO_S = integer varia tra 0 e 100</div><div>GISTAT_SEZ = integer sempre 0</div><div><br></div><div>Manca inoltre il campo COD_REG che č ovviamente sempre uguale a 19 per questo shapefile.</div>
<div><br></div><div><br></div><div>Se c'é spazio su <a href="http://openstreetmap.it">openstreetmap.it</a> potremmo ripubblicare gli stessi dati dell'ISTAT ripuliti e quindi riutilizzabili pių facilmente.</div><div>
<br></div><div>Ciao<br></div><div>/niubii/</div><div><br></div><div><br></div></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">Il giorno 21 marzo 2014 10:41, marco bra <span dir="ltr"><<a href="mailto:marcobra.ubuntu@gmail.com" target="_blank">marcobra.ubuntu@gmail.com</a>></span> ha scritto:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Daniele<br>
Dai dati tirati gių il:<br>
<br>
mar 21 09:23 dati_sc_provvisori.zip<br>
<br>
ci sono gli stessi problemi in altri files csv, ulteriormente, viene<br>
usato erroneamente come apice il backtick invece dell'apostrofo<br>
normale:<br>
<br>
R18_Dati_SC_2011_provvisori.csv:150488: sparse in corso di<br>
validazione;;;;VIA;DELL` ACQUA SOLFUREA;13;<br>
<br>
Per un totale di righe:<br>
<br>
grep -n "\`" *.csv > /tmp/tot ; wc -l /tmp/tot<br>
<br>
385278 tot<br>
<br>
Poi forse ci saranno altri caratteri "sporchi"<br>
<br>
Poi per pulire, se serve:<br>
<br>
#!/bin/bash<br>
<br>
for fi in $(ls -1 *.csv); do<br>
fo=puli_$fi<br>
echo "---------------------------------------------"<br>
echo "Linee entranti" $(wc -l $fi)<br>
cat $fi | sed "s/\`/'/g;s/^[ \t]*//;s/[ \t]*$//" > $fo;<br>
echo "Linee entranti" $(wc -l $fo)<br>
echo "Controllo a posteriori per verificare presenze non volute"<br>
grep -e "^ " $fo<br>
grep -n "\`" $fo<br>
done<br>
<br>
<br>
Ciao ...<br>
Marco<br>
<br>
<br>
<br>
<br>
Il 20 marzo 2014 20:06, Francesco Pelullo <<a href="mailto:f.pelullo@gmail.com">f.pelullo@gmail.com</a>> ha scritto:<br>
<div class="HOEnZb"><div class="h5">> Io li ho ripuliti ed importati in una sola tabella dentro un db spatialite.<br>
><br>
> Se serve posso caricarli da qualche parte.<br>
><br>
> Stavo dando un'occhiata agli shapefiles, anche quelli... lasciamo perdere.<br>
><br>
> Sto bestemmiando per completare l'import degli shp in un altro db<br>
> spatialite. Se ci riesco vorrei incrociare le geometrie con le sezioni per<br>
> verificare oltre a Milano quali sono gli altri comuni senza toponomastica.<br>
><br>
> Ciao<br>
> /niubii/<br>
><br>
> Il 20/mar/2014 18:53 "Daniele Forsi" <<a href="mailto:dforsi@gmail.com">dforsi@gmail.com</a>> ha scritto:<br>
><br>
>> Il 20 marzo 2014 17:49, Simone Cortesi <<a href="mailto:simone@cortesi.com">simone@cortesi.com</a>> ha scritto:<br>
>> > 2014-03-20 17:46 GMT+01:00 marco bra <<a href="mailto:marcobra.ubuntu@gmail.com">marcobra.ubuntu@gmail.com</a>>:<br>
>> >> Si ti confermo dall riga 1.470.533 fino a riga 1.470.567<br>
>> ><br>
>> > <a href="https://twitter.com/istat_it/status/446647022087864320" target="_blank">https://twitter.com/istat_it/status/446647022087864320</a><br>
>> ><br>
>> > @simonecortesi @OpenStreetMapIt I file dei Dati toponomastici<br>
>> > pubblicati lunedė presentavano un problema di formattazione che oggi č<br>
>> > risolto<br>
>><br>
>> i problemi di formattazione non erano *uno* erano almeno *due*<br>
>> hanno corretto la virgola come separatore, ma le righe che diceva<br>
>> anche Marco sono sempre spezzate:<br>
>><br>
>> nei dati scaricati oggi ci sono ancora delle righe che iniziano con uno<br>
>> spazio:<br>
>> grep -e "^ " Dati_SC_provvisori/R01_Dati_SC_2011_provvisori.csv<br>
>> sparse in corso di validazione;;;;CASCINA;MAZZUCCO;1;<br>
>> sparse in corso di validazione;;;;LOCALITA';CORSIETTA;1;<br>
>> sparse in corso di validazione;;;;STRADA;OLTREPO;1;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;1;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;10;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;11;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;12;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;13;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;14;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;15;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;16;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;17;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;18;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;2;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;3;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;4;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;5;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;6;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;7;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;8;<br>
>> sparse in corso di validazione;;;;VIA;CAMPELLO;9;<br>
>><br>
>> Simone, Napo la prossima volta che vi capita di parlare con qualcuno<br>
>> che vuole liberare dei dati suggeritegli di mettere in piedi una<br>
>> testsuite, basta "wc -l" per contare le righe e scoprire se nei file<br>
>> ce ne sono di pių o di meno del previsto<br>
>><br>
>> --<br>
>> Daniele Forsi<br>
>><br>
>> _______________________________________________<br>
>> dev-italia mailing list<br>
>> <a href="mailto:dev-italia@openstreetmap.org">dev-italia@openstreetmap.org</a><br>
>> <a href="https://lists.openstreetmap.org/listinfo/dev-italia" target="_blank">https://lists.openstreetmap.org/listinfo/dev-italia</a><br>
><br>
><br>
> _______________________________________________<br>
> dev-italia mailing list<br>
> <a href="mailto:dev-italia@openstreetmap.org">dev-italia@openstreetmap.org</a><br>
> <a href="https://lists.openstreetmap.org/listinfo/dev-italia" target="_blank">https://lists.openstreetmap.org/listinfo/dev-italia</a><br>
><br>
<br>
<br>
<br>
</div></div><div class="im HOEnZb">--<br>
Linux Infinite Freedom<br>
<br>
I'm writing from this place:<br>
<a href="http://www.openstreetmap.org/?lat=44.39945&lon=8.6798&zoom=15&layers=M" target="_blank">http://www.openstreetmap.org/?lat=44.39945&lon=8.6798&zoom=15&layers=M</a><br>
<br>
</div><div class="HOEnZb"><div class="h5">_______________________________________________<br>
dev-italia mailing list<br>
<a href="mailto:dev-italia@openstreetmap.org">dev-italia@openstreetmap.org</a><br>
<a href="https://lists.openstreetmap.org/listinfo/dev-italia" target="_blank">https://lists.openstreetmap.org/listinfo/dev-italia</a><br>
</div></div></blockquote></div><br></div>