<div dir="ltr">Come al solito una iniziativa utilissima: grazie! In effetti quello a cui si può contribuire (in questo caso correggere) è ciò che appare nella propria zona, oltre che al proprio contributo.<div>Ho corretto gran parte delle segnalazioni per quanto riguarda Livorno, dovrebbero essere rimasti solo i "falsi positivi", i nomi che effettivamente sono corretti.</div>
<div><br></div><div style>A quando l'aggiornamento degli estratti ? Hai pensato di fare una nuova versione dell' "highway checker" [1] con i nomi dei comuni come chiave ? La combinazione dei due tool potrebbe dare risultati davvero interessanti.<br>
</div><div style><br></div><div style>Ciao!</div><div style>F.</div>
<div><br></div><div>[1] <a href="http://www.forsi.it/osm/spellcheck/highway/">http://www.forsi.it/osm/spellcheck/highway/</a><br></div><div><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">Il giorno 09 marzo 2013 12:58, Daniele Forsi <span dir="ltr"><<a href="mailto:dforsi@gmail.com" target="_blank">dforsi@gmail.com</a>></span> ha scritto:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Buongiorno :)<br>
<br>
A proposito di controlli di qualità, sto mettendo a punto una nuova<br>
procedura che risolva qualche problema di quella attuale, il<br>
principale è che di solito non è possibile controllare una città<br>
intera perché l'elenco dei nomi è diviso tra più persone e questo l'ho<br>
risolto (però qualche strada appare in due Comuni anche se è tutta<br>
compresa in uno solo, devo verificare se è sbagliata la mia query o se<br>
è danneggiato il confine).<br>
<br>
Nella nuova procedura ho caricato solo la Toscana (aggiornata al 2<br>
marzo perché è l'ultimo estratto disponibile su<br>
<a href="http://download.gfoss.it/osm/osm/regioni/" target="_blank">http://download.gfoss.it/osm/osm/regioni/</a>) e qui non si possono<br>
segnalare le parole come giuste o sbagliate, però si può continuare a<br>
farlo nell'altra perché questa usa il suo database per controllare<br>
l'ortografia:<br>
<a href="http://www.forsi.it/osm/spellcheck/highway/boundary/" target="_blank">http://www.forsi.it/osm/spellcheck/highway/boundary/</a><br>
la ricerca trova anche parti di nomi e i pigri possono inserire _ per<br>
ottenere l'elenco completo (questo probabilmente lo limiterò a qualche<br>
decina di risultati)<br>
<br>
Segue un po' di spiegazione e di numeretti.<br>
<br>
Al momento sono caricati 17661 nomi distinti di strade che si trovano<br>
in 289 Comuni toscani e che usano 11394 parole distinte di cui 4039<br>
sono sconosciute alla nuova procedura, che si riducono a 2456 usando i<br>
dati della vecchia procedura; su queste parole sconosciute potrei<br>
provare l'estrazione di nomi e cognomi da dbpedia di cui si parlava<br>
tempo fa; per chi le vuol guardare per farsi un'idea, le 2456 parole<br>
sono qui: <a href="http://www.forsi.it/osm/spellcheck/highway/unknown-words.txt" target="_blank">www.forsi.it/osm/spellcheck/highway/unknown-words.txt</a><br>
<br>
Nell'elenco dei nomi (limitato a un massimo di 2000 nomi), la prima<br>
colonna ha il collegamento per Remote Control che carica tutte le way<br>
interessate,<br>
la seconda mostra il nome evidenziando le parole sconosciute,<br>
la terza spiega quali sono i problemi individuati, cioè:<br>
<br>
Ortografia da controllare.<br>
Sono le parole sconosciute al correttore ortografico e all'altra<br>
procedura (quella divisa per utente); ci sono tanti falsi positivi,<br>
specialmente sui cognomi.<br>
<br>
Punti, virgole o altra punteggiatura non ammessa.<br>
Si riferisce principalmente alle abbreviazioni, ma anche a punti<br>
interrogativi e altri caratteri diversi da numeri e lettere.<br>
<br>
Parola singola.<br>
Il nome è composto da una parola sola.<br>
<br>
Non inizia con Via, Piazza, ecc.<br>
La prima parola non è una di quelle conosciute (ne ho aggiunte 5 e ora<br>
siamo a 147, non vorrei aggiungerne altre se non si riferiscono a<br>
strade importanti)<br>
<br>
Errore maiuscole/minuscole.<br>
Questo indica i soliti errori della pagina di Groppo perché uso la<br>
stessa espressione regolare.<br>
<br>
Spazi iniziali. Spazi finali. Doppi spazi.<br>
Il nome contiene spazi non significativi.<br>
<span class="HOEnZb"><font color="#888888">--<br>
Daniele Forsi<br>
<br>
_______________________________________________<br>
Talk-it mailing list<br>
<a href="mailto:Talk-it@openstreetmap.org">Talk-it@openstreetmap.org</a><br>
<a href="http://lists.openstreetmap.org/listinfo/talk-it" target="_blank">http://lists.openstreetmap.org/listinfo/talk-it</a><br>
</font></span></blockquote></div><br></div>