[Talk-it] Piccoli errori di ortografia nei nomi

Daniele Forsi dforsi at gmail.com
Thu Nov 25 11:43:24 GMT 2010


Alcuni nomi hanno due lettere maiuscole consecutive, è principalmente
un problema estetico perché una ricerca per nome deve ignorare queste
differenze, però vorrei correggerli.

Ho trovato 632 tag[1] in italy.osm del 20 novembre di cui 313 tag[2]
iniziano con VIa o PIazza, ma dei 632 alcuni non sono gestibili
facilmente in modo automatico.

Mi chiedevo se zoosm può essere usato per fare correzioni del genere,
quale sarebbe il formato?

Ad esempio da:
  way_id  |  k   |                v
----------+------+---------------------------------
 18111066 | name | VIa Ferrone
 24061775 | name | VIa Pietro Mascagni
...

come dovrebbe diventare?
way_id,name
18111066,Via Ferrone
24061775,Via Pietro Mascagni
...
c'è un modo perché il programma capisca di non fare modifiche se il
tag è cambiato? Non vorrei che nel frattempo qualcuno abbia modificato
dei nomi totalmente sbagliati (es. VIa Tizio, modficata da qualcuno in
Via Caio, e io la cambio in Via Tizio con la "i" minuscola).

Sarebbe utile tenere traccia di quali way_id sono stati modificati
perché si possono trovare dei casi ambigui, se zoosm non lo fa, va
fatto durante la preparazione dei dati, ad esempio "VIa" potrebbe
essere un numero romano per "sesta", al momento non ce ne sono ma c'è
un "IIa" per "seconda" e potrebbe capitare che per errore li
modifichiamo con un bot e poi un umano li corregge e potrebbe iniziare
una edit war.

[1] SELECT * FROM way_tags WHERE k='name' AND v ~ '[A-Z]{2}[a-z]{1,}';
[2] SELECT * FROM way_tags WHERE k='name' AND v LIKE 'VIa%' OR v LIKE 'PIazza%';
-- 
Daniele Forsi



More information about the Talk-it mailing list