[OSM-talk-fr] Chiffres romains

Philippe Verdy verdy_p at wanadoo.fr
Ven 26 Juin 18:41:35 UTC 2015


Il y en en encore d'autres: il y a encore d'autres "chiffres" codés pour
500, mille, un million et un chiffre spécial en forme de C à l'envers pour
former des grand nombres (en combinaison avec le C et le I).

A cela il y a encore la convention utilisant les macrons (tirets hauts) en
un ou plusieurs exemplaires comme multiplicateur par 1000.

Ces chiffres sont utilisés dans CLDR (cependant il ne doit pas y avoir
beaucoup de cas de noms de rues avec des nombres supérieurs à 500, la
plupart sont des petits nombres et le dernier que je vois est le 23 (pour
le pape "Jean XXIII" qui a donné des noms de rues).

Les dates parfois sont notées en romains (pour les années) mais utilisent
les chiffres latins de base MDCLXVI, mais rarement sur les noms de rues
(ils sont plus souvent vus sur les dates de publication ou de copyright des
œuvres).

L'autodétection simple poserait problème dans certains cas: DI, LI, IL mais
comme par convention on n'utilise pas l'écriture en toutes capitales,
l'idée serait que seuls les nombres romains entièrement en capitales
seraient reconnus comme tels et pour les autres cas on capitalisera
uniquement l'initiale si nécessaire: "Li, di, il" qui ne seront donc pas
lus comme des romains.

Cependant des navigateurs GPS ont des formats de fichier imposant la
conversion entièrement en capitales (c'est leur façon de compresser les
données). Ils ne pourront pas faire la différence et devront se débrouiller
(ils ne savant pas non plus lire les extensions phonétiques, mais e,n
revanche peuvent afficher certains champs de note à défaut de les
prononcer).

Bref on revient à la solution de fournir un alt_name=* utilisant les
chiffres arabo-européens (0-9) pour lever les ambiguités éventuelles d'une
lecture incorrecte de cas comme "D 8III" ; les navigateurs GPS font une
reconnaissance automatique des nombres romains isolés si on les écrit en
"mots" séparés : "D 8 III" et donc "Georges V" est lu sans problème
(d'autant plus qu'on évite les abréviations dans les noms).


Le 26 juin 2015 19:39, Jérôme Seigneuret <jseigneuret-pro at yahoo.fr> a écrit
:

> En effet, j'ai trouvé ça dans la partie *general ponctuation* de la table
> utf-8
>
> Voici les codes
>
>    Unicode Caractère UTF-8 encodage HTML name
> U+2160
> Ⅰ 226133160 Ⅰ ROMAN NUMERAL ONE  U+2161 Ⅱ 226133161 Ⅱ ROMAN
> NUMERAL TWO
> U+2162
> Ⅲ 226133162 Ⅲ ROMAN NUMERAL THREE  U+2163 Ⅳ 226133163 Ⅳ ROMAN
> NUMERAL FOUR  U+2164 Ⅴ 226133164 Ⅴ ROMAN NUMERAL FIVE  U+2165 Ⅵ
> 226133165 Ⅵ ROMAN NUMERAL SIX  U+2166 Ⅶ 226133166 Ⅶ ROMAN
> NUMERAL SEVEN  U+2167 Ⅷ 226133167 Ⅷ ROMAN NUMERAL EIGHT  U+2168 Ⅸ
> 226133168 Ⅸ ROMAN NUMERAL NINE  U+2169 Ⅹ 226133169 Ⅹ ROMAN
> NUMERAL TEN  U+216A Ⅺ 226133170 Ⅺ ROMAN NUMERAL ELEVEN  U+216B Ⅻ
> 226133171 Ⅻ ROMAN NUMERAL TWELVE  U+216C Ⅼ 226133172 Ⅼ ROMAN
> NUMERAL FIFTY  U+216D Ⅽ 226133173 Ⅽ ROMAN NUMERAL ONE HUNDRED
> U+216E Ⅾ 226133174 Ⅾ ROMAN NUMERAL FIVE HUNDRED  U+216F Ⅿ 226133175
> Ⅿ ROMAN NUMERAL ONE THOUSAND  U+2170 ⅰ 226133176 ⅰ SMALL
> ROMAN NUMERAL ONE  U+2171 ⅱ 226133177 ⅱ SMALL ROMAN NUMERAL TWO
> U+2172 ⅲ 226133178 ⅲ SMALL ROMAN NUMERAL THREE  U+2173 ⅳ 226133179
> ⅳ SMALL ROMAN NUMERAL FOUR  U+2174 ⅴ 226133180 ⅴ SMALL ROMAN
> NUMERAL FIVE  U+2175 ⅵ 226133181 ⅵ SMALL ROMAN NUMERAL SIX  U+2176 ⅶ
> 226133182 ⅶ SMALL ROMAN NUMERAL SEVEN  U+2177 ⅷ 226133183 ⅷ SMALL
> ROMAN NUMERAL EIGHT  U+2178 ⅸ 226133184 ⅸ SMALL ROMAN NUMERAL NINE
> U+2179 ⅹ 226133185 ⅹ SMALL ROMAN NUMERAL TEN  U+217A ⅺ 226133186
> ⅺ SMALL ROMAN NUMERAL ELEVEN  U+217B ⅻ 226133187 ⅻ SMALL
> ROMAN NUMERAL TWELVE  U+217C ⅼ 226133188 ⅼ SMALL ROMAN NUMERAL FIFTY
> U+217D ⅽ 226133189 ⅽ SMALL ROMAN NUMERAL ONE HUNDRED  U+217E ⅾ
> 226133190 ⅾ SMALL ROMAN NUMERAL FIVE HUNDRED  U+217F ⅿ 226133191
> ⅿ SMALL ROMAN NUMERAL ONE THOUSAND
>
>
> Sinon, la phonétique c'est un autre cas peut-être plus complexe, mais ça
> évite les interprétations incorrectes. ;-)
>
> Le 26 juin 2015 19:37, David Crochet <david.crochet at free.fr> a écrit :
>
>> Bonjour
>>
>> Le 26/06/2015 18:11, JB a écrit :
>>
>>> Pour moi, la solution devrait venir de l'utilisateur
>>>
>>
>> Hum,  je pense pas, mais cela dépasse la sphère JOSM ou OSM ou autre,
>> c'est au monde entier de l'informatique d'abandonner le code ISO et de
>> passer à l'UNICODE
>>
>> Ce sera déjà un grand pas dans l'uniformisation des données
>>
>> Cordialement
>>
>> --
>> David Crochet
>>
>>
>> _______________________________________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-fr
>>
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20150626/71848954/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr