[dev-italia] Dati ISTAT provvisori

marco bra marcobra.ubuntu a gmail.com
Ven 21 Mar 2014 09:41:03 UTC


Daniele
Dai dati tirati gių il:

mar 21 09:23 dati_sc_provvisori.zip

ci sono gli stessi problemi in altri files csv, ulteriormente, viene
usato erroneamente come apice il backtick invece dell'apostrofo
normale:

R18_Dati_SC_2011_provvisori.csv:150488:    sparse in corso di
validazione;;;;VIA;DELL` ACQUA SOLFUREA;13;

Per un totale di righe:

grep -n  "\`" *.csv > /tmp/tot ; wc -l /tmp/tot

385278 tot

Poi forse ci saranno altri caratteri "sporchi"

Poi per pulire, se serve:

#!/bin/bash

for fi in $(ls -1 *.csv); do
   fo=puli_$fi
   echo "---------------------------------------------"
   echo "Linee entranti" $(wc -l $fi)
   cat $fi | sed "s/\`/'/g;s/^[ \t]*//;s/[ \t]*$//" > $fo;
   echo "Linee entranti" $(wc -l $fo)
   echo "Controllo a posteriori per verificare presenze non volute"
   grep -e "^ " $fo
   grep -n  "\`" $fo
done


Ciao ...
Marco




Il 20 marzo 2014 20:06, Francesco Pelullo <f.pelullo a gmail.com> ha scritto:
> Io li ho ripuliti ed importati in una sola tabella dentro un db spatialite.
>
> Se serve posso caricarli da qualche parte.
>
> Stavo dando un'occhiata agli shapefiles, anche quelli... lasciamo perdere.
>
> Sto bestemmiando per completare l'import degli shp in un altro db
> spatialite. Se ci riesco  vorrei incrociare le geometrie con le sezioni per
> verificare oltre a Milano quali sono gli altri comuni senza toponomastica.
>
> Ciao
> /niubii/
>
> Il 20/mar/2014 18:53 "Daniele Forsi" <dforsi a gmail.com> ha scritto:
>
>> Il 20 marzo 2014 17:49, Simone Cortesi <simone a cortesi.com> ha scritto:
>> > 2014-03-20 17:46 GMT+01:00 marco bra <marcobra.ubuntu a gmail.com>:
>> >> Si ti confermo dall riga 1.470.533 fino a riga 1.470.567
>> >
>> > https://twitter.com/istat_it/status/446647022087864320
>> >
>> > @simonecortesi @OpenStreetMapIt I file dei Dati toponomastici
>> > pubblicati lunedė presentavano un problema di formattazione che oggi č
>> > risolto
>>
>> i problemi di formattazione non erano *uno* erano almeno *due*
>> hanno corretto la virgola come separatore, ma le righe che diceva
>> anche Marco sono sempre spezzate:
>>
>> nei dati scaricati oggi ci sono ancora delle righe che iniziano con uno
>> spazio:
>> grep -e "^ " Dati_SC_provvisori/R01_Dati_SC_2011_provvisori.csv
>>     sparse in corso di validazione;;;;CASCINA;MAZZUCCO;1;
>>     sparse in corso di validazione;;;;LOCALITA';CORSIETTA;1;
>>     sparse in corso di validazione;;;;STRADA;OLTREPO;1;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;1;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;10;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;11;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;12;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;13;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;14;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;15;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;16;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;17;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;18;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;2;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;3;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;4;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;5;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;6;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;7;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;8;
>>     sparse in corso di validazione;;;;VIA;CAMPELLO;9;
>>
>> Simone, Napo la prossima volta che vi capita di parlare con qualcuno
>> che vuole liberare dei dati suggeritegli di mettere in piedi una
>> testsuite, basta "wc -l" per contare le righe e scoprire se nei file
>> ce ne sono di pių o di meno del previsto
>>
>> --
>> Daniele Forsi
>>
>> _______________________________________________
>> dev-italia mailing list
>> dev-italia a openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/dev-italia
>
>
> _______________________________________________
> dev-italia mailing list
> dev-italia a openstreetmap.org
> https://lists.openstreetmap.org/listinfo/dev-italia
>



-- 
Linux Infinite Freedom

I'm writing from this place:
http://www.openstreetmap.org/?lat=44.39945&lon=8.6798&zoom=15&layers=M



Maggiori informazioni sulla lista dev-italia