Pour continuer le sujet de la variabilité des noms selon le contexte, le français (ou les langues romanes et germaniques) restent (en apparence seulement) encore des cas simples.<div><br></div><div>Mais si vous regardez les autres langues cela se complique sérieusement :<div>
- les langues slaves déclinent tous les nom propres</div><div>- les langues celtiques (breton ou irlandais par exemple) et sémitiques (arabe par exemple) pratiquent *aussi* la mutation des initiales selon les mots qui les précèdent et des règles complexes de phonologie.</div>
<div>- les langues sémitiques (arabe ou hébreu) ne notent pas toujours les voyelles (points diacritiques) n'importe où dans les mots, ou peuvent n'en écrire qu'une partie ou bien toutes (ce n'est pas le cas de toutes les langues en écriture arabe, qui ont introduit des lettres à part entière pour les voyelles en systématisant ces voyelles et en ajoutant quelques lettres au besoin)</div>
<div>- ces mêmes langues peuvent noter aussi la cantillation (optionnelle, comme si on pouvait noter en français contextuellement avec un accent particulier les voyelles longues, ou les syllabes emphasées d'un stress, ou d'une intonation particulière, marquant l'intention de l'auteur selon le contexte, au lieu d'utiliser des termes supplémentaires).</div>
<div>- les langues "asiatiques" ne marquent pas systématiquement le genre, le nombre, la déclinaison, le temps ou la fonction, que ce soit par des adverbes, articles, déclinaisons, mais par agglutination de morphèmes, qui se contractent souvent par mutation aussi dans la racine ! Un exemple européen est la langue finnoise.</div>
<div>- les mutations ne concernent pas toujours uniquement l'initiale mais aussi phonologiquement (selon des règles parfois complexes) des éléments au milieu de la racine (un exemple existe en français dans les mutations internes des racines des verbes du fait de la conjugaison : des accents ou lettres apparaissent ou disparaissent selon le temps, le mode, ou la personne, mais aussi dans les termes dérivés des noms propres comme les gentilés qui sont bourrés souvent de mutations, quand ils ne vont pas chercher leur racine dans un autre terme ou dans une autre langue!).</div>
</div><div><br></div><div>On peut croire qu'on peut laisser de côte les gentilés (dont la séparation est claire dans les langues romanes ou germaniques) mais c'est souvent difficile dans les autres langues où ils sont formés par les types de dérivation précédents (par exemple par agglutination et mutations).</div>
<div class="gmail_extra"><br></div><div class="gmail_extra">De fait, il est important dans OSM de pouvoir savoir dans quelle langue les "name=*" sont écrits, et aussi avoir une idée de ce qui constitue dedans des termes ou morphèmes génériques (communs) ou propres (car les règles de dérivation sont alors très différentes et propres à chaque langue identifiée).<br>
<br><div class="gmail_quote">Le 30 novembre 2012 15:26, Philippe Verdy <span dir="ltr"><<a href="mailto:verdy_p@wanadoo.fr" target="_blank">verdy_p@wanadoo.fr</a>></span> a écrit :<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Il y a malgré tout moyen de faire un compromis si vous voulez garder la capitale dans la base partout: d'abord le problème ne français ne concerne que les mots « Le » ou « Les » écrits en tête. Dans la plupart des cas ce sont bien articles, ils sont donc contractables.<div>
<br></div><div>Dans les autres cas rares, ce sont des exceptions qui peuvent être marqués spécialement pour dire que ce ne sont pas des articles mais des noms propres, donc que d'une part ce n'est pas une capitale typographique, mais bien une majuscule invariable (name:fr:invariable_case=yes). Cela pourrait concerner d'autres noms propres que les toponymes.</div>
<div><br></div><div>Pour ne pas faire d'autres exceptions, on a choisi de garder les articles devant les noms de cours d'eau. Cependant ces articles ne font pas partie de l'odonyme lui-même : la minuscule s'impose. On reconnait alors ces articles à condition qu'on sache que c'est bien du français.</div>
<div><br></div><div>D'autre part il faut savoir dans quelle langue est effectivement écrit le nom par défaut (name=*) : on n'est pas obligé de le dire dans tous les name=* si l'objet désigné est dans un pays ou une région dont on connait la langue officielle (ce name devrait être dans cette langue). Cela se complique dans les pays ou régions qui ont plusieurs langues co-officielles (par exemple les communautés autonomes espagnoles, ou la région de Bruxelles-Capitale, ou même la Région wallone où l'allemand est aussi coofficiel dans une partie, la distinction linguistique ne se faisant pas au niveau des régions administratives en Belgique, mais au niveau des communautés linguistiques).</div>
<div><br></div><div>Pour indiquer la/les langues officielles dans une région (administrative ou autre entité politique dans OSM), on peut indiquer cette langue, ou ces langues dans un tag. Si un lieu fait partie de plusieurs régions adminsitratives ou autres entités poltiiques, toutes les langues indiquées sont coofficielles (ou ont un statut régional réconnu). A la suite de quoi on se retrouve avec un name=* qui peut n'être alors que dans l'une de ces langues ou plusieurs de celles-ci.</div>
<div>Si les règles orthographiques, grammaticales, ou autres ne permettent pas de décider comment appliquer une règle, on n'a pas d'autre choix que de détailler les noms de ces langues avec leurs propres règles, et on ne dérivera pas le name=* par défaut qui reste dans une langue ambiguë..</div>
<div><br></div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">Le 30 novembre 2012 14:37, Philippe Verdy <span dir="ltr"><<a href="mailto:verdy_p@wanadoo.fr" target="_blank">verdy_p@wanadoo.fr</a>></span> a écrit :<div>
<div class="h5"><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Très bien, il mentionne « <span style="font-family:arial,sans-serif;font-size:13px">l’article initial s’il n’est pas contracté avec à ou de » et suppose qu'on puisse reconnaitre qu'il s'agit d'un article (cela oblige à en garder la trace dans une base de données.</span><div>
<span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div><span style="font-family:arial,sans-serif;font-size:13px">Et le CNIG se place dans le cadre de la « composition », ce qui de fait exclue le cas « base de données » qui doit préserver cette différence d'une façon ou d'une autre. La base de données a bien vocation à garder les différences lexicales, ce n'est pas le contexte de la composition dont parle le CNIG.</span></div>
<div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">Le 30 novembre 2012 14:31, Plop76 <span dir="ltr"><<a href="mailto:vaujaniate@free.fr" target="_blank">vaujaniate@free.fr</a>></span> a écrit :<div>
<div><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dans son message précédent, Philippe Verdy a écrit :<div><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Pourquoi veux-tu que OSM se limite aux cartes ? OSM c'est une base de<br>
données, pas une carte. Les cartes c'est du domaine du rendu.<br>
<br>
OSM a bien d'autres usages comme la possibilité d'utiliser la base comme<br>
source d'informations pour composer toutes sortes de documents avec des<br>
inclusions dans le texte d'une partie de ces données, avec des liens<br>
hypertextes possibles vers des rendus cartographiques très divers, ou pas<br>
de carte du tout, par exemple dans des tableaux de données, où le nom ne<br>
sera pas non plus nécessairement le premier élément affiché dans une<br>
cellule).<br>
<br>
Bref le CNIG ne touche qu'au rendu des cartes, rien d'autre.<br>
</blockquote>
<br></div>
Ils s'occupent de "l'information géographique" :D<br>
Ils font justement la distinction entre les cartes (où la majuscule est de toute façon due au début de phrase) et le cas général.<br>
<br>
Pour le cas général, ils recommandent :<br>
<br>
«Dans un toponyme (quel que soit son mode de composition), ou dans un nom de<br>
territoire politique ou administratif composé par jonction par des traits d’union,<br>
prennent la majuscule :<br>
[...]<br>
- l’article initial s’il n’est pas contracté avec à ou de le précédant (La Rochelle, Le Puy,<br>
Le Havre, la municipalité du Touquet et non de Le Touquet, aller au Mans et non à Le Mans<br>
[DAF, « le »] au lieudit « La Fourche », « Le Cheval mort » [DAF, « lieudit »]).<br>
»<br>
<br>
Et concernant l'IGN :<br>
<br>
«Ainsi, dans les toponymes officieux, l’IGN et le SHOM omettent<br>
actuellement les traits d’union et l’IGN la majuscule à l’article initial. Cette exception s’apparente à l’usage de signes typographiques comme la couleur des caractères, la police italique ou le corps<br>
des caractères»<br>
<br>
;-)<div><div><br>
<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
Talk-fr mailing list<br>
<a href="mailto:Talk-fr@openstreetmap.org" target="_blank">Talk-fr@openstreetmap.org</a><br>
<a href="http://lists.openstreetmap.org/listinfo/talk-fr" target="_blank">http://lists.openstreetmap.<u></u>org/listinfo/talk-fr</a><br>
</div></div></blockquote></div></div></div><br></div>
</blockquote></div></div></div><br></div>
</blockquote></div><br></div>