[OSM-talk-fr] Fwd: RE: Utilisation des fiches de géodésie et de nivellement

Frédéric Rodrigo f.rodrigo at free.fr
Mar 16 Juin 13:20:17 UTC 2009


Le vendredi 12 juin 2009, Eric Sibert a écrit :
> Emilie Laffray <emilie.laffray at gmail.com> a �crit :
> > Je vais regarder d'un peu plus pres les pages webs. Je pense qu'il doit
> > etre assez facile d'ecrire un scraper pour les pages webs s'il y a un
> > moyen d'acceder a une liste.
>
> Je pense que le serveur ftp peut permettre de constituer une liste.
> Pour la géodésie, à chaque site est associée une fiche en pdf (stocké
> dans un zip/tar). Le nom du fichier pdf correspond au numéro du site.
> Ensuite, deux voies:
> - on arrive à extraire le contenu du pdf et on l'analyse (j'ai déjà
> fait ce genre de chose sous windows avec xpdf je crois) pour extraire
> tous les repères du site.
> - on déduit l'adresse de la page web du site géodésique. On analyse la
> page web. On suit les liens en milieu de page pour arriver à la page
> web de chaque repère. On analyse cette dernière page.
>
>
> Sinon, à regarder de nouveaux les fiches, j'ai vu quelques autres détails:
> - les sites ont un nom (en plus de leur numéro). Ca serait bien de le
> récupérer.
> - les différents repères d'un site sont considérés comme des "Points
> du site". Ils sont désignés par une lettre, un chiffre ou rien
> (repères disparus). C'est différent du numéro du site. Idem si c'est
> possible à récupérer.
> - les numéros de point des différents repères d'un site ne sont ni
> dans l'ordre, ni tous attribués.
> Exemple : http://geodesie.ign.fr/fiche_geodesie.asp?num_site=7630701
> comporte dans l'ordre les points 2, 3, 1 5 et 7.
> - les "Points d'un site" n'ont pas de nom mais une désignation.
> "Chateau : Clocheton : Centre du renflement"
>
> Eric

Jeudi suite à mon mail j'avais commencé à travailler sur les fiches pdf. 
Résultat j'ai déjà téléchargé toutes les fiches (3Go). Et extrait les données 
depuis les pdf. J'ai (quasiment) un fichier cvs avec les données (5Mo).

Je met ça à dispo dès que j'ai le temps de finir, en fait il me reste à bosser 
sur les départements d'outre mer.

A+
Fred
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: signature.asc
Type: application/pgp-signature
Taille: 197 octets
Desc: This is a digitally signed message part.
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20090616/9c0287fb/attachment.sig>


Plus d'informations sur la liste de diffusion Talk-fr