[Talk-it] Confronto con lo stradario di Venezia

Andrea Musuruane musuruan a gmail.com
Dom 14 Apr 2013 10:36:00 UTC


2013/4/14 Daniele Forsi <dforsi at gmail.com>

> Il 12 aprile 2013 11:31, Andrea Musuruane ha scritto:
>
> > Molto interessante. Sarebbe utile inserire qualche algoritmo di matching
> di
> > tipo fuzzy per identificare possibili piccoli errori (o orrori).
>
> c'è già fin dall'inizio in tutti e 3 gli "stradari", in ognuno un po'
> diverso perché diversi sono i formati originali: in tutti i casi ho
> ignorato le lettere accentate, poi quello di Trento ho gestito
> esplicitamente le abbreviazioni perché sono tante, questo di Venezia
> ne ha poche e quindi le ho ignorate, quello di Bari ha un ordine
> particolare delle parole quindi controllo solo che siano presenti in
> qualsiasi ordine
> c'è qualcosa che mi è sfuggito?
>

Vado a memoria su quello che avevo notato a Venezia: assenza di spazi tra
due parole (alTraghetto invece di al Traghetto), lettera mancante in una
parola (Ognisanti, ognissanti), uso di lettere romane (Pio X, Pio Decimo),
uso cifre (6 maggio, Sei maggio), uso di preposizioni differenti
(dell'Anzolo, de l'Anzolo).

Ci sono delle librerie specifiche che aiutano a rilevare queste
similitudini. In quale linguaggio hai scritto il tuo programma?

Ciao,

Andrea.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.openstreetmap.org/pipermail/talk-it/attachments/20130414/5bf0d0c5/attachment.html>


Maggiori informazioni sulla lista Talk-it