[OSM-talk-fr] Regexp pour valider un nom de commune française
Charles Nepote
charles at nepote.org
Mar 28 Mar 15:57:55 UTC 2017
Le 28/03/2017 à 14:47, Philippe Verdy a écrit :
> Il manque sans doute des majuscules accentuées (ÂÊ).
Oui bien vu, c'est une erreur de m part.
>
> Tu peux toujours essayer avec la liste complète des communes et tenter
> un rapprochement, une requête Overpass sur les relation
> admin_level=8/9 (prendre en compte peut-être à part Wallis-et-Futuna
> qui n'a pas de communes mais des districts et villages, pour la
> Polynésie je pense qu'on a déjà les noms de communes et îles toutes
> présentes après en avoir fait le tour exhaustivement, mais si tu
> t'intéresses juste aux communes, la liste en outre-mer n'est pas aussi
> longue qu'en métropole). Après ça il y a des noms de quartiers et
> d'anciennes communes fusionnées au niveau 10.
Alors moi je suis vraiment nul en requête Overpass mais preneur d'une
liste en CSV.
> Concernant la fin (entre parenthèse) cela semble trop restrictif aussi
> de se limiter à l'alphabet de base sans accent et un seul mot.
La fin c'est Christian Quest qui me l'a soufflée pour gérer les deux
seuls cas :
* Château-Chinon (Campagne)
* Château-Chinon (Ville)
(qui sont une hérésie, soit dit en passant).
Je pourrais en effet étendre aux capitales accentuées et lettre
accentuées mais aussi, pourquoi-pas, aux noms composés, etc. Pourquoi ne
pas continuer à mettre n'importe quoi dans les parenthèses ? On pourrait
légitimement avoir :
**Château-Chinon - Ville Magne du Rotrou (Saint Martin et Villedieux)**
Un cas purement théorique mais une telle horreur est tout à fait
possible si l'on tient compte des conneries précédentes. Je fais donc le
pari, plus ou moins risqué, que les deux exemples tordus de
Château-Chinon ne se reproduiront pas à brève échéance.
Charles.
> Le 28 mars 2017 à 14:32, Charles Nepote <charles at nepote.org
> <mailto:charles at nepote.org>> a écrit :
>
> Bonjour à tous,
>
>
> Un peu hors-sujet mais ça pourrait aider les outils de contrôle
> qualité d'OSM.
> Dans les divers outils et process informatiques il n'est pas
> toujours possible d'aller appeler la BAN pour vérifier le nom
> d'une commune.
> Je cherche donc à vérifier a minima la syntaxe d'un nom de commune
> à travers une regexp. J'ai produit la regexp suivante qui passe
> mes tests sauf qu'elle me semble un peu trop permissive. Toute
> remarque ou aide appréciée :)
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20170328/67c972d7/attachment.htm>
Plus d'informations sur la liste de diffusion Talk-fr