[OSM-talk-fr] Fwd: RE: Utilisation des fiches de géodésie et de nivellement
Eric Sibert
courrier at eric.sibert.fr
Ven 12 Juin 12:59:10 UTC 2009
Emilie Laffray <emilie.laffray at gmail.com> a �crit :
> Je vais regarder d'un peu plus pres les pages webs. Je pense qu'il doit etre
> assez facile d'ecrire un scraper pour les pages webs s'il y a un moyen
> d'acceder a une liste.
Je pense que le serveur ftp peut permettre de constituer une liste.
Pour la géodésie, à chaque site est associée une fiche en pdf (stocké
dans un zip/tar). Le nom du fichier pdf correspond au numéro du site.
Ensuite, deux voies:
- on arrive à extraire le contenu du pdf et on l'analyse (j'ai déjà
fait ce genre de chose sous windows avec xpdf je crois) pour extraire
tous les repères du site.
- on déduit l'adresse de la page web du site géodésique. On analyse la
page web. On suit les liens en milieu de page pour arriver à la page
web de chaque repère. On analyse cette dernière page.
Sinon, à regarder de nouveaux les fiches, j'ai vu quelques autres détails:
- les sites ont un nom (en plus de leur numéro). Ca serait bien de le
récupérer.
- les différents repères d'un site sont considérés comme des "Points
du site". Ils sont désignés par une lettre, un chiffre ou rien
(repères disparus). C'est différent du numéro du site. Idem si c'est
possible à récupérer.
- les numéros de point des différents repères d'un site ne sont ni
dans l'ordre, ni tous attribués.
Exemple : http://geodesie.ign.fr/fiche_geodesie.asp?num_site=7630701
comporte dans l'ordre les points 2, 3, 1 5 et 7.
- les "Points d'un site" n'ont pas de nom mais une désignation.
"Chateau : Clocheton : Centre du renflement"
Eric
Plus d'informations sur la liste de diffusion Talk-fr