[Talk-it] import civici Emilia Romagna

Lorenzo Perone lorenzo.perone a gmail.com
Gio 7 Lug 2016 18:34:15 UTC


>
>
> Ciao Lorenzo,
> per ora stavo cercando di capire dove aprire la pagina wiki per
> documentare e coordinare l'import. Ho appena creato la pagina
>
> http://wiki.openstreetmap.org/wiki/IT:Emilia_Romagna_import_numeri_civici_2016
> , sarà da linkare sulla pagina principale della wiki regionale. E' giusto
> una bozza.
> Trovi/ate il link alla pagina che permette il download dei dati già divisi
> per Provincia.
> Per la modalità ci si mette d'accordo.
> ieri ho scaricato la Provincia di Piacenza ed ho visto che già sui nomi
> delle strade c'è parecchio da lavorare: alcuni nomi mancanti (al loro
> posto i record '98' e '99'), formattazioni diverse a seconda della fonte
> del dato, errori banali (Via Fratelli Corvi, ecc..).
> OK, pagina creata, segniamo i nomi di chi è disponibile a mettiamoci
> d'accordo sulla metodologia.
> Alessandro Ale_Zena_IT


Ciao Ale,
direi che come ispirazione possiamo usare la pagina del Friuli, come
suggerito da Giovanni.
Mi sembra di ricordare è stata l'ultima in ordine cronologico di mass
import dei civici.
Per quello che riguarda la normalizzazione dei nomi delle strade mi
piacerebbe usare questo

http://okfnlabs.org/reconcile-csv/

io l'ho usato per normalizzare i nome dei comuni in banche dati piuttosto
ampie.
Se creiamo dei dizionari possiamo normalizzare i nomi delle strade con una
classificazione semi-automatica utilizzando una logica Fuzzy, per la mia
esperienza è un buon sistema.

Se siete interessati possiamo lavorare assieme alla cosa.


> Una cosa che non avevo considerato è l'uso della funzione
> overpass-turbo "around", che magari, assieme al match parziale può
> aiutare:
> se in opendata abbiamo
> "Via"
> "Garibaldi G." (si, lo so, ma ci sono pure questi casi)
> "58"
> è possibile intercettare anche l'ipotetico preesistente
> addr:street=Viale Giuseppe Garibaldi
> addr:housenumber=58


Questa è un'ipotesi interessante, per deformazione ho la tendenza a
normalizzare il dato alfanumerico via DB e
poi procedere con analisi spaziali ma questa potrebbe essere l'occasione
per testare l'efficenza di approcci diversi.

Io intanto mi sono "segnato" nella pagina wiki creata da Ale.

Quale può essere la fonte di dati toponomastici più pulita disponibile? È
necessario partire dai dati presenti sui civici?

Ciao.
l.
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.openstreetmap.org/pipermail/talk-it/attachments/20160707/f8d23d9a/attachment.html>


Maggiori informazioni sulla lista Talk-it