[OSM-talk-fr] [Cadastre] Bug rcc-list/rcc-grab

Guillaume Rosaire zerog0 at gmail.com
Ven 24 Juil 19:23:45 UTC 2009


Salut,

Je comprenais pas pourquoi certaines communes qui apparaissent comme
vectorisées sur cadastre.gouv.fr ne pouvaient être importées par les scripts
d'import des communes.

Un exemple :
Département Maine et Loire (049), j'ai 2 communes par exemple qui sont :
- Le Plessis-Macé
- Le Plessis Grammoire

dans 049-liste.csv issu de l'appel à rcc-list.sh, j'ai par exemple :
ANGERS,49100,KA007,VECT
PLESSIS-GRAMMOIRE,LE,49124,'KA241'
PLESSIS-MACE,LE,49770,'KA242'

Ca marche bien pour la première (Angers), mais pas pour les suivantes.  Il y
a un bug dans le script de génération du CSV qui doit pas aimer ce qu'il
recoit ou le parse mal et affiche 'LE' en 2eme champs du csv.

Pour que mon import marche pour mes 2 communes, dans ce cas, j'ai du mettre
dans le fichier rcc-grab-batch.list les lignes suivantes :

PLESSIS-GRAMMOIRE (LE)
PLESSIS-MACE (LE)

Y a t'il un moyen de corriger le script rcc-list ?
Voici ma proposition, remplacer la dernière ligne suivante  du script :
cat tmp/page-2.html | \
sed "s/<table/\n<table/g" | grep 'class="resultat"' | sed
's/.*<strong>\(.*\) <\/strong>.*ajoutArticle\(.*\)title="Ajouter.*/\1\2/' |
\
sed 's/ *[\(]/,/g' | tr -d ')";' | sed 's/ *[\(]/,/g' | tr -d ')";' | \
cut -d ',' -f1,2,3,4 | sed "s/,'\(.*\)','\(.*\)'$/,\1,\2/" >
${departement}-liste.csv

Par :
cat tmp/page-2.html | perl -lne "while (/<strong>(.+?)
\((\d+)\).*?<\/strong>.*?ajoutArticle\('(.*?)','(.*?)','(.*?)'\)/g) { print
\"\$1,\$2,\$3,\$4\"; }"

(ca doit pouvoir se raccourcir un peu mais au moins ça marche, et c'est
moins lourd que tous ces grep, sed, cut ;-)

Cordialement,
Guillaume
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20090724/92c87652/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr