[OSM-talk-fr] Regexp pour valider un nom de commune française

Charles Nepote charles at nepote.org
Mar 28 Mar 15:57:55 UTC 2017


Le 28/03/2017 à 14:47, Philippe Verdy a écrit :
> Il manque sans doute des majuscules accentuées (ÂÊ).
Oui bien vu, c'est une erreur de m part.


>
> Tu peux toujours essayer avec la liste complète des communes et tenter 
> un rapprochement, une requête Overpass sur les relation 
> admin_level=8/9 (prendre en compte peut-être à part Wallis-et-Futuna 
> qui n'a pas de communes mais des districts et villages, pour la 
> Polynésie je pense qu'on a déjà les noms de communes et îles toutes 
> présentes après en avoir fait le tour exhaustivement, mais si tu 
> t'intéresses juste aux communes, la liste en outre-mer n'est pas aussi 
> longue qu'en métropole). Après ça il y a des noms de quartiers et 
> d'anciennes communes fusionnées au niveau 10.
Alors moi je suis vraiment nul en requête Overpass mais preneur d'une 
liste en CSV.


> Concernant la fin (entre parenthèse) cela semble trop restrictif aussi 
> de se limiter à l'alphabet de base sans accent et un seul mot.
La fin c'est Christian Quest qui me l'a soufflée pour gérer les deux 
seuls cas :
* Château-Chinon (Campagne)
* Château-Chinon (Ville)
(qui sont une hérésie, soit dit en passant).
Je pourrais en effet étendre aux capitales accentuées et lettre 
accentuées mais aussi, pourquoi-pas, aux noms composés, etc. Pourquoi ne 
pas continuer à mettre n'importe quoi dans les parenthèses ? On pourrait 
légitimement avoir :
**Château-Chinon - Ville Magne du Rotrou (Saint Martin et Villedieux)**
Un cas purement théorique mais une telle horreur est tout à fait 
possible si l'on tient compte des conneries précédentes. Je fais donc le 
pari, plus ou moins risqué, que les deux exemples tordus de 
Château-Chinon ne se reproduiront pas à brève échéance.

Charles.



> Le 28 mars 2017 à 14:32, Charles Nepote <charles at nepote.org 
> <mailto:charles at nepote.org>> a écrit :
>
>     Bonjour à tous,
>
>
>     Un peu hors-sujet mais ça pourrait aider les outils de contrôle
>     qualité d'OSM.
>     Dans les divers outils et process informatiques il n'est pas
>     toujours possible d'aller appeler la BAN pour vérifier le nom
>     d'une commune.
>     Je cherche donc à vérifier a minima la syntaxe d'un nom de commune
>     à travers une regexp. J'ai produit la regexp suivante qui passe
>     mes tests sauf qu'elle me semble un peu trop permissive. Toute
>     remarque ou aide appréciée :)
>

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20170328/67c972d7/attachment-0001.html>


Plus d'informations sur la liste de diffusion Talk-fr