[Talk-it] dataset MISE distributori

Cascafico Giovanni cascafico a gmail.com
Mar 17 Apr 2018 08:51:06 UTC


Il giorno 28 marzo 2018 11:46, Andrea Musuruane <musuruan at gmail.com> ha
scritto:

> Nel file description viene messo l'indirizzo. Sarebbe meglio riuscire a
>>> metterlo in addr:street e addr:housenumber (per quelli che hanno un numero
>>> civico, per gli altri l'informazione mi sembra inutile).
>>>
>>
>> Onestamente non saprei come processare la stringa... l'unica certezza di
>> questo campo è il codice postale alla fine. La ho assegnata a description,
>> pensando che il mappatore occasionale possa eventualemnte aggiungere il
>> civico manualmente. Anche il no rari riferimenti kilometrici (p.es. "Ss
>> 356 Km 45+5112") potrebbero essere utili per mettere qualche milestone,
>> seppure mi pare siano relegate ad ogetti historic.
>>
>
> Si può fare in questo modo.
>
> Estrai tre valori dalla stringa in base alla seguente espressione regolare:
> (.*),*\s+(\d+\/*\w*),*\s+(\d{5})
>
> Se l'espressione regolare non è soddisfatta si scarta la stringa.
>

Ho applicato al regexp in qgis (necessario anteporre un ulteriore backslash
ad ogni backslash)
regexp_substr ("Indirizzo", '(.*),*\\s+(\\d+\\/*\w*),*\s+(\\d{5})' )

ed estrae il nome strada per circa metà dei record. Speriamo che il modulo
online che il MISE sta pubblicando per i gestori ci semplichi la vita :-)


>
A questo punto, compili i campi addr:street con il primo valore,
> addr:housenumber con il secondo (rimuovendo lo slash se questa è seguito
> solo da lettere), addr:postcode con il terzo e addr:city con il valore del
> campo COMUNE.
>
> Da notare che bisognerà comunque fare qualche passo di QA perché il valore
> del campo addr:street difficilmente sarà uguale a quello della strada
> inserita in OSM, siccome i dati sorgente non rispettano le regole OSM
> (niente abbreviazioni, ecc).
>

per gli odonimi persone, direi che non vengono mai rispettate.



> Mi chiedo però se ha senso importare gli indirizzi nelle aree dove è già
> stato fatto un import (o dove sarà fatto).
>

Il tool di conflation prevede di non sovrascrivere i tag già valorizzati: è
necessario definirli esplicitamente.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.openstreetmap.org/pipermail/talk-it/attachments/20180417/d7066f87/attachment.html>


Maggiori informazioni sulla lista Talk-it