[OSM-talk-fr] Suppression des tirets cadratins

Philippe Verdy verdy_p at wanadoo.fr
Ven 30 Nov 09:57:36 UTC 2012


Hmmmm.... tu te prends donc à utiliser la notation ASCII avec un double
signe moins (même encadrés d'espaces).
C'est une vieille notation anglophone qui effectivement remplace un unique
tiret demi-cadratin. Le cadratin utilisant une succession de 3 ou 4 tirets
ASCII.
Et tu crois que c'est simple ? On a une base Unicode, et ces vieilles
notations de l'ASCII (y compris -> pour remplacer une vraie flèche) c'est
du passé.

Mais tu noteras quand même que tu as eu besoin de distinguer les tirets en
les multipliant.

On trouve depuis peu cette notation (avec des tirets simples réitérés comme
dans "nom1--nom2" pour distinguer de "nom1-nom2" utilisé dans les noms
composés inséparables) dans les fichiers INSEE de l'état-civil pour les
noms de familles associant deux noms patronymiques avant mariage,
uniquement parce que ces fichiers ne supportent pas Unicode encore
aujourd'hui (ce qui ensuite se retrouve sur les passeports imprimés), ni
même Windows-1252, mais juste ISO 8859-1 (pour garder les accents). L'INSEE
a été critiquée pour cette décision (on peut comprendre qu'elle ait besoin
d'enregistrer les romanisations pour un usage français, mais elle doit
encore être capable de garder les orthographes originales (même si c'est du
chinois, du grec, du cyrillique ou de l'arabe, car seuls ces noms sont non
ambigus et réellement officiels) dans des champs séparés de celui consacré
à la romanisation (mais tant qu'à faire, améliorer les outils pour que ces
romanisations soient automatisées selon des règles émanant du pays
d'origine et non selon ses propres règles, et de ne réserver les autres
romanisations qu'aux seuls noms d'usage choisis et réellement enregistrés
officiellement par le demandeur à l'INSEE).

Mais on n'a aucune raison d'utiliser ces vieilles notations. La base
Unicode est en Unicode pour supporter d'autres alphabets. Les outils qui ne
savent ps lire l'Unicode ne pourront pas travailler sur les libellés en
cyrillique ou en grec par exemple (ils devront utiliser de coûteuses et
instables romanisations). Il n'y a aucun intérêt dans le cas de la base
OSM. Les outils doivent s'adapter à l'Unicode pour gagner en stabilité.

Ce n'est pas à a basse OSM de s'adapter à ces outils. Mais si ces outils
confondent tous les tirets (simples, multiples, demi-cadratin, cadratin,
voire aussi les flèches unidirectionnelles ou bidirectionelles) comme un
seul tiret simple, ils génèrent des ambiguïtés et en prennent le risque.
Mais doit-on aussi les confondre en introduisant volontairement ces
ambiguités ?

Les tirets simples de l'ASCII ont toujours été ambigus dans leur
signification. OK si certains ne font pas la distinction ils peuvent saisir
des tirets simples, ou des successions de tirets simples (et autres
polygrammes pour les flèches), mais on ne doit pas interdire aux autres de
corriger avec les bons caractères signifiants et non ambigus.





Le 30 novembre 2012 09:30, Mikaël Cordon <mikael.cordon at gmail.com> a écrit :

> >si je suis d'accord sur le principe, il reste possible aux tenants de la
> simplicité (et ça aussi c'est bien, mangez-en) d'utiliser des tirets
> simples partout, à condition de les encadrer d'espaces -- ou non -- selon
> le cas.
>
> >On peut donc se contenter de : Champs-Élysées - Clemenceau
>
> Évidemment !
> Il n’a jamais été question de contraindre ceux qui ne veulent ou ne
> peuvent pas à utiliser une typographie avancée.
> Mais, comme on est d’accord qu’une typographie avancée enrichi les
> données, il ne faut pas contraindre ceux qui le veulent et le peuvent à ne
> pas l’utiliser.
>
> Cordialement,
> --
> Mikaël Cordon, mickey86
>
>
> Le 29 novembre 2012 22:08, Jean-Francois Nifenecker <
> jean-francois.nifenecker at laposte.net> a écrit :
>
> Bonjour,
>>
>> Le 28/11/2012 18:29, teuxe at free.fr a écrit :
>>
>>       Champs-Élysées — Clemenceau (avenue des Champs-Élysées, place
>>> Clemenceau)
>>>
>>>
>> si je suis d'accord sur le principe, il reste possible aux tenants de la
>> simplicité (et ça aussi c'est bien, mangez-en) d'utiliser des tirets
>> simples partout, à condition de les encadrer d'espaces -- ou non -- selon
>> le cas.
>>
>> On peut donc se contenter de : Champs-Élysées - Clemenceau
>>
>> A+
>> --
>> Jean-Francois Nifenecker, Bordeaux
>>
>>
>> ______________________________**_________________
>> Talk-fr mailing list
>> Talk-fr at openstreetmap.org
>> http://lists.openstreetmap.**org/listinfo/talk-fr<http://lists.openstreetmap.org/listinfo/talk-fr>
>>
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-fr
>
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20121130/781e8f15/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr