<div class="gmail_quote">Le 26 février 2010 16:07, Guillaume Audirac <span dir="ltr"><<a href="mailto:guillaume.audirac@gmail.com">guillaume.audirac@gmail.com</a>></span> a écrit :<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="gmail_quote"><div>Ouahou ! Et ça inclut aussi la correction du bug sur les communes avec article placé postérieurement ?<br>Exemple dans la Manche:<br>
DEZERT (LE)<br>PERRON (LE)<br>etc...<br><br>Car ces communes là n'étaient pas extraites auparavant.<br></div></div></blockquote><div> </div></div>Bon j'ai essayé d'améliorer les choses en modifiant le script "rcc-list.sh". Voici ce que ça donne:<br>
Avant (extrait du fichier 050-liste.csv pour la Manche):<br>DEZERT,LE,50620,'KK161'<br>PERRON,LE,50160,'KK398'<br>LA LANDE D&#039AIROU,50800,KL262,VECT<br>[...]<br>Après:<br>DEZERT (LE),50620,KK161,VECT<br>
PERRON (LE),50160,KK398,VECT<br>LA LANDE D&#039;AIROU,50800,KL262,VECT<br clear="all">[...]<br><br>Il y a 28 communes dans ce format (via le site du cadastre) dans la Manche. Bien sûr, le patch marche aussi avec les communes sans article entre parenthèses ;-)<br>
Le seul problème restant concerne les apostrophes (39 en ascii). J'ai joué du echo -e "\039" combiné avec sed mais sans succès. Ça me semble être le seul bug restant.<br><br>J'ai essayé un autre département en lançant un diff sur les fichiers csv, tout à l'air bon.<br>
Voici le script "rcc-list.sh" modifié:<br><br>======================<br># 033, 020, ... sur 3 chiffres<br>departement=$1<br><br>curl -c tmp/cookies-1 "<a href="http://www.cadastre.gouv.fr/scpc/rechercherPlan.do">http://www.cadastre.gouv.fr/scpc/rechercherPlan.do</a>" > tmp/page-1.html<br>
curl -b tmp/cookies-1 -c tmp/cookies-2  "<a href="http://www.cadastre.gouv.fr/scpc/listerCommune.do?codeDepartement=${departement}&libelle=&keepVolatileSession=&offset=5000">http://www.cadastre.gouv.fr/scpc/listerCommune.do?codeDepartement=${departement}&libelle=&keepVolatileSession=&offset=5000</a>" > tmp/page-2.html<br>
<br>[ -f "${departement}-liste.csv" ] && mv "${departement}-liste.csv" "${departement}-liste-$$.csv"<br><br>cat tmp/page-2.html | \<br>sed "s/<table/\n<table/g" | grep 'class="resultat"' | sed 's/.*<strong>\(.*\) <\/strong>.*ajoutArticle\(.*\)title="Ajouter.*/\1\2/' | \<br>
sed 's/ *)(/,/g' | sed 's/ *(\([0-9][0-9][0-9][0-9][0-9]\)/,\1/' | cut -d, -f1,2,3,4 | sed "s/'//g" > ${departement}-liste.csv<br>======================<br><br>Cordialement,<br>-- <br>Guillaume<br>