[OSM-talk-fr] Sourcer les limites administratives

Denis dhelfer at free.fr
Mer 2 Juin 18:58:40 UTC 2010


Emilie Laffray a écrit :

> Je pense que le sourçage est important mais qu'on n'aurait jamais un 
> sourçage qui équivaudra aux méta données du monde de la geomatique.

Le sourcage fait partie des métadonnées des données géolocalisées, selon 
l'ISO 19115 (et autres normes annexes).
J'aurai plutôt tendance à dire qu'OSM est un poil plus loin que beaucoup 
d'acteurs de la géomatique "classique". En effet, nous parlons de 
sourcage au niveau objet tandis que le monde de la géomatique raisonne 
en terme de lot de données. Ainsi, on pourrait imaginer un lot "limites 
administratives" issu de la base OSM dont le texte descriptif de la 
provenance pourrait être libellé ainsi :
"Digitalisation à partir des données cadastrales pour l'essentiel du 
lot. Par endroits, des corrections peuvent avoir été effectuées par 
repérage GPS ou par conflation avec des informations issues d'autres 
lots de données (réseau routier, réseau hydrographique)".

Même le sourcage, au niveau objet, tel que pratiqué par l'IGN dans sa 
BD, Topo, ne renseigne pas beaucoup l'utilisateur final quand c'est 
indiqué : "précédente version de la BD Topo" (exemple pris dans le monde 
réel ;-)

> Comment fait on quand on a le premier point crée en utilisant Yahoo, 
> puis modifie avec une trace GPS maison et en superposition avec le 
> cadastre? Doit on mettre source=Yahoo;GPS;Cadastre? Je ne suis pas sure 
> que ça aide beaucoup et que ça aide a l'évaluation de la qualité.

Un sourcage au niveau "point" ne me parait pas indispensable car, au 
,final, ce n'est qu'un couple (ou un triplet) de coordonnées 
géographiques. L'important c'est l'objet qu'il constitue. La qualité 
géométrique n'est qu'une composante, parmi beaucoup d'autres de 
l'analyse de la qualité d'une donnée (exhaustivité, précision 
temporelle, respect d'une sémantique, etc.)
Bien évidemment, les POI sont à la fois des points et des objets.

Il ne faut pas oublier que l'historique disponible des objets constitue 
un système de métadonnées en lui-même (processus de constitution de la 
donnée). Certes, il y a des applications à développer pour rendre cette 
information plus utilisable (genre osmdiff), mais l'info de base est 
déjà stockée.

> Maintenant on peut parler des sources auxquelles on a accès comme le 
> cadastre qui est une source fantastique pour tracer. Est ce que mettre 
> source=cadastre indique vraiment la qualité des données? Après tout, il 
> y a une bonne part d'interprétation puisqu'il n'y a pas de données 
> vectorielles pour les routes. Maintenant pour un bâtiment, la 
> source=cadastre veut vraiment dire quelque chose, pour une route, ,
> nettement moins puisque la qualité du cadastre n'est pas homogène, et 
> que ça dépend beaucoup de l'utilisateur qui fait l'interprétation. De 
> plus dans mon cas, je vérifie toujours quand j'ajoute une roue d'après 
> le cadastre que ça corresponde a peu près aux images Yahoo.

A mon avis, il ne faut pas confondre qualité et qualité. Je m'explique :
Des limites de PNR digitalisées sur fond de scan25 peuvent être d'une 
qualité suffisante pour beaucoup d'utilisateurs aux conditions que :
1. la source de création doit identifiée
2. les seuils de tolérance soient explicités (longueur minimale d'un 
tronçons de x m)
3. la plage d'échelles d'utilisation de la donnée soit indiquée
etc.
Bref, la donnée peut être d'une qualité 'absolue' pas terrible ; 
pourtant elle acquiert de la qualité parce que ses limites et 
utilisations sont clairement définies. C'est l'objectif de la directive 
INSPIRE

D'un autre côté on peut avoir des objets parfaitement positionnés mais 
sans le minimum de documentation, la qualité géométrique, même 
l'exhaustivité, la conformité aux critères de définition seront inutiles 
  s'ils restent implicites.

Une donnée moyenne bien documentée vaut plus qu'une donnée "pointue" 
mais mal ou pas documentée.
Mettre qu'une route a été digitalisée à partir du cadastre ne veut pas 
dire qu'elle sera plus "juste" qu'une autre version réalisée à partir de 
traces GPS. L'utilisateur, en revanche, s'il veut estimer plus finement 
la qualité géométrique de la donnée, ira consulter les planches 
concernées dans le premier cas ; dans le second cas il saura qu'en 
milieu urbain, le niveau de précision peut chuter.

> Mettre source quand on peut oui, inciter a l'utilisation, je ne suis pas 
> convaincue que ça aide vraiment au débat sur la qualité des données en 
> règle générale.

Ne pas mettre de source à un objet équivaut à jeter une ombre sur sa 
provenance. Même si ce n'est pas toujours facile mais mieux vaut faire 
maladroitement que pas du tout.

> Même pour les traces GPS, on ne peut pas se fier autre mesure a ce qu'on 
> obtient. Si tu veux vraiment quelque chose qui soit plus utile, doit on 
> enregistrer aussi les données comme les différents DOP, la position des 
> satellites dans le ciel, les alentours (pour savoir si le multipath est 
> important ou pas), sa vitesse (histoire d'avoir une meilleure idée de 
> l'effet Doppler), le firmware du GPS, la version de la puce? Ce sont 
> autant de facteurs qui peuvent jouer sur la qualité d'une trace GPS sans 
> parler que ces paramètres changent a travers le temps.
> Je pense que le débat de la qualité des données se résoudra d'une autre 
> manière a terme, mais a mes yeux, source n'est qu'une petite partie de 
> ce débat surtout quand on a une source hybride au final.

A titre personnel et expérimental, je source toutes les adresses que je 
rentre dans OSM avec les indications suivantes :
- source=survey : l'adresse a été repérée terrain (de visu ou par photo)
- source=cadastre : l'adresse est reprise du cadastre (soit visuellement 
sur le plan soit par interrogation des propriétés de la parcelle)
- source=interpolation : l'adresse est déduite de 2 valeurs adjacentes
- source=extrapolation : l'adresse est déduite d'une valeur adjacente

En exploitation, je peux raisonnablement me dire que si le taux 
d'adresses d'une zone de source survey (ou cadastre) est important , la 
qualité de l'ensemble est plus importante que l'absence de source ou 
d'inter/extrapolation.

mes 0.02€

Denis




Plus d'informations sur la liste de diffusion Talk-fr