[OSM-talk-fr] Re : pb de limites de communes ( dép 51)
Guillaume Audirac
guillaume.audirac at gmail.com
Dim 28 Fév 05:02:04 UTC 2010
Le 27 février 2010 23:25, Guillaume Audirac <guillaume.audirac at gmail.com> a
écrit :
>
> Bon j'ai essayé d'améliorer les choses en modifiant le script
> "rcc-list.sh". Voici ce que ça donne:
> Avant (extrait du fichier 050-liste.csv pour la Manche):
> DEZERT,LE,50620,'KK161'
> PERRON,LE,50160,'KK398'
> LA LANDE D'AIROU,50800,KL262,VECT
> [...]
> Après:
> DEZERT (LE),50620,KK161,VECT
> PERRON (LE),50160,KK398,VECT
> LA LANDE D'AIROU,50800,KL262,VECT
> [...]
>
> Il y a 28 communes dans ce format (via le site du cadastre) dans la Manche.
> Bien sûr, le patch marche aussi avec les communes sans article entre
> parenthèses ;-)
> Le seul problème restant concerne les apostrophes (39 en ascii). J'ai joué
> du echo -e "\039" combiné avec sed mais sans succès. Ça me semble être le
> seul bug restant.
>
> J'ai essayé un autre département en lançant un diff sur les fichiers csv,
> tout à l'air bon.
> Voici le script "rcc-list.sh" modifié:
>
Bon finalement, j'ai fait simple et voici le script gérant les noms avec
articles et apostrophes.
Script "rcc-list.sh":
=================
# 033, 020, ... sur 3 chiffres
departement=$1
curl -c tmp/cookies-1 "http://www.cadastre.gouv.fr/scpc/rechercherPlan.do" >
tmp/page-1.html
curl -b tmp/cookies-1 -c tmp/cookies-2 "
http://www.cadastre.gouv.fr/scpc/listerCommune.do?codeDepartement=${departement}&libelle=&keepVolatileSession=&offset=5000<http://www.cadastre.gouv.fr/scpc/listerCommune.do?codeDepartement=$%7Bdepartement%7D&libelle=&keepVolatileSession=&offset=5000>"
> tmp/page-2.html
[ -f "${departement}-liste.csv" ] && mv "${departement}-liste.csv"
"${departement}-liste-$$.csv"
cat tmp/page-2.html | \
sed "s/<table/\n<table/g" | grep 'class="resultat"' | sed
's/.*<strong>\(.*\) <\/strong>.*ajoutArticle\(.*\)title="Ajouter.*/\1\2/' |
\
sed 's/ *)(/,/g' | sed 's/ *(\([0-9][0-9][0-9][0-9][0-9]\)/,\1/' | cut -d,
-f1,2,3,4 | sed "s/'//g" | sed "s/'/'/" > ${departement}-liste.csv
=================
Cordialement,
--
Guillaume
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20100228/c81b804b/attachment.htm>
Plus d'informations sur la liste de diffusion Talk-fr