[Talk-it] Tag 'visible_name'
Daniele Forsi
dforsi a gmail.com
Lun 8 Ago 2011 12:19:13 BST
Ho fatto qualche elaborazione sull'italy.osm del 3 agosto dove c'erano
oltre 1 milione 100 mila highway di cui oltre 400 mila avevano un
nome.
Ho preparato un'interfaccia spartana per controllare quei nomi che
iniziano con una parola che ho abbastanza arbitrariamente giudicato
poco comune, alcuni sono certamente errori (come i nomi senza via,
piazza, ecc.), altri sono nomi locali.
Se volete aiutarmi nei controlli andate su
http://www.forsi.it/osm/20110803/highway/ e inserite il vostro nick,
appariranno solo i nomi delle highway da controllare per i quali avete
fatto l'ultima modifica e potete modificarl tramite RemoteControl
(anche questo spartano, niente Javascript), quindi se non ci siete
vuol dire che tutti i vostri nomi sono a posto; se qualcosa non vi
torna ditemelo. Forse i sentieri sono da escludere, d'altra parte
sarebbe bene uniformare CAI e C.A.I. e l'uso della parola "sentiero".
Questa è la frequenza con cui i nomi delle way iniziano con le parole
presenti nel wiki (le riporto in minuscolo per ignorare le differenze
tra maiuscole e minuscole):
count | name
--------+--------------------
8 | stazione
27 | salizada
35 | porta
59 | campo
106 | fondamenta
148 | corte
489 | piazzetta
737 | strada regionale
753 | calle
842 | ponte
1071 | strada comunale
1848 | località
2282 | largo
2421 | piazzale
3738 | vicolo
5204 | corso
6384 | strada provinciale
7061 | strada statale
12018 | piazza
17465 | viale
293303 | via
(21 rows)
somma: 355999, per queste abbiamo un'abbreviazione univoca eccetto
Piazzetta e Porta
15274 highway hanno nomi formati da una sola parola e potrebbero
essere errori e 34211 iniziano con parole che più o meno
arbitrariamente io ho considerato "poco comuni"; le trovate tramite
l'interfaccia di cui sopra; quelle che appaiono 100 volte o più sono:
4200 | fixme
341 | a16 napoli-canosa
261 | ss36 del lago di como e dello spluga
239 | a5 autostrada della val d'aosta
193 | a26
155 | ss342 briantea
143 | grande raccordo anulare
141 | asse di supporto
139 | ss162 asse mediano
134 | pedemontana
128 | bradanica
115 | ss268
114 | a30 autostrada caserta salerno
111 | tagenziale ovest
107 | a4
101 | a14
a proposito: NON usate "fixme" nel nome, usatelo come tag separato
su certi nomi ho dei dubbi, ad esempio nell'elenco sopra name="a16
napoli-canosa" dovrebbe essere piuttosto name="autostrada
napoli-canosa", ref="a16"? (con le maiuscole al posto giusto, qui è in
minuscolo per come ho fatto la query) Però queste modifiche non si
possono calare dall'alto perché può darsi che certi nomi siano usati
localmente e va bene che siano inseriti così, tanto quando il ref è
giusto si può fare una tabella di nomi canonici per autostrade,
statali, ecc. proverò a farla.
infine 3007 hanno visible_name (di queste 1287 hanno anche name, 1720
hanno solo visible_name), nessuna ha short_name
Per quanto riguarda la seconda parola, le più frequenti sono:
12737 | del
10041 | della
9248 | san
8485 | dei
8172 | di
6785 | giuseppe
5607 | delle
5025 | giovanni
per un totale di 34026 parole diverse tra cui molti nomi che possiamo
abbreviare con l'iniziale, cognomi che no posiamo abbreviare mai e
numeri facenti parte di date (forse per i mesi possiamo usare le
abbreviazioni di tre lettere, certo che "Via 1 maggio" => "V. 1 mag" è
brutto).
Le parole più corte probabilmente non si potranno abbreviare (molte
sono articoli, preposizioni o già abbreviate):
count | length
-------+--------
25106 | 4
41547 | 3
24663 | 2
3680 | 1
per ora è tutto
--
Daniele Forsi
Maggiori informazioni sulla lista
Talk-it