[OSM-dev-fr] Import des numéros de rue (addr:housenumber) depuis le Cadastre
Pierre
pinaraf at pinaraf.info
Ven 4 Nov 00:25:25 GMT 2011
On Thursday, November 03, 2011 12:22:12 PM Tyndare wrote:
> Je suis partis sur une approche plus simpliste qui doit être similaire
> à ta première tentative. Je me contente des données récupérée par
> qadastre: un Path composé d'une liste de commandes (moveto, lineto,
> curveto) et une liste de coordonnées associées.
> J'ai pris comme à priori que les numéros de rue seraient toujours
> écris avec la même police et devrais donc être composés exactement des
> même commandes dans le même ordre.Ensuite pour comparer la liste des
> coordonnées associées aux commandes, j'applique une transformation
> (déplacement et rotation) pour ramener la première de la liste à (0,0)
> et la troisième à l'horizontale (en choisissant la deuxième ça ne
> marchait pas pour le chiffre 3) et je met le tout à échelle pour que
> ça rentre dans un carré d'1 de large.
> Ca a l'air très fiable si les coordonnées sont assez précises, et je
> pense que c'est généralisable au texte (chaque mot génère un Path mais
> il faut ensuite les assembler).
J'avais codé une solution statistique de reconnaissance du texte sur un principe
similaire (avec assemblage des mots, rotation puis traitement des «delta», mais
je m'étais heurté aux soucis indiqués par Frédéric, et j'avais alors arreêté.
> Pour les problèmes de tailles, je commence à me dire qu'il n'y a pas
> d'autre solution que de repartir sur un découpage des requêtes au
> cadastre en plusieurs pdf comme le fait le script import-bati.sh
Oui, il faudra faire ça. Par contre, ça implique *beaucoup* de travail.
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: signature.asc
Type: application/pgp-signature
Taille: 198 octets
Desc: This is a digitally signed message part.
URL: <http://lists.openstreetmap.org/pipermail/dev-fr/attachments/20111104/7faa645e/attachment.pgp>
Plus d'informations sur la liste de diffusion dev-fr