[OSM-talk-fr] Première évaluation de la qualité des données libres d'OpenStreetMap en France
Serge Mang GAIAGO
s.mang at gaiago.fr
Mar 17 Nov 16:14:49 UTC 2009
A Denis: J'ai bien aimé la comparaison avec les pièces d'une habitation.
A Emilie: Oui, je suis d'accord sur le fait qu'une application trop
contraignante ferait fuir les contributeurs, et donc tuerait le projet.
L'idée était de partir de la théorie, pour lancer le débat. Apparemment,
les réactions n'ont pas trainé et prouvent la réactivité de la communauté.
Il faut réflechir ensemble à des spécifications qui permettraient de
vérouiller un peu plus la topologie et le modèle de données, et qui
permettraient d'augmenter la quantité de métadonnées, sans pour autant
contraindre le contributeur.
Et c'est possible, selon moi.
Pour les métadonnées, il faut au moins forcer le renseignement de la (ou
des) source(s). Si on n'a pas d'informations sur la précision
géométrique de la source, il faut pouvoir donner à ceux qui souhaitent
en savoir plus les moyens de retrouver cette information. En indiquant
qu'on a utilisé un GPS standard, on indique déjà quelque chose
(précision de +/- 10 m voire pire en milieu urbain dense ou avec couvert
végétal). En indiquant qu'on s'est basé sur la photo aérienne de Yahoo,
en tel endroit, on dit aussi des choses, sans forcément connaître
soi-même la précision altimétrique de l'ortho en cet endroit (mais
quelqu'un qui veut retrouver l'info pour compléter le peut, et ce, sur
une granulométrie plus large que le seul objet saisi). En indiquant
qu'on a utilisé le cadastre, là, on ne donne aucune information de
précision géométrique, car cette dernière est très hétérogène d'une zone
à l'autre.
Lorsqu'il y a plusieurs sources, ou lorsqu'on modifie un objet déjà
produit avec une source A pour le préciser à l'aide d'une source B,
alors intervient la notion très importante de généalogie de l'objet (un
peu comme la traçabilité d'une barquette de côtes d'agneau). Cette
notion doit être approfondie.
On pourrait donc simplement demander le renseignement de la source de la
contribution (donc cette information serait portée non plus par l'objet
mais par l'historique de ses modifications) parmi une liste de valeurs
FIXEE (GPS, french cadastre, aerial photography, local knowledge,
other...). Mais là, j'ouvre un autre débat: qui a le droit de fixer et
d'étendre cette liste de valeurs? Comme dans Wikipédia, la notion des
différents niveaux d'écriture se fait jour, d'une manière ou d'une
autre. La validation de la saisie (ou de la modification) ne serait
acquise que lorsque la source serait renseignée.
D'autres informations, qui dépendent de la valeur précédemment rentrée
et du lieux pourraient être affectées automatiquement (on sait que sur
Toulouse, l'ortho a telle précision en EMQ, on sait que les droits
d'utilisation du cadastre sont restreints, etc...).
Je pense que les métadonnées doivent au maximum descendre au niveau le
plus bas de granularité, quand cela est possible, et quand cela ne
risque pas de faire fuir le contributeur.
J'attire l'attention sur la notion de responsabilité d'un producteur de
données, quelles qu'elles soient (critiques sur Allociné, article sur
Moïse dans Wikipédia, container à verre dans OSM, article dans Rue89,
etc...). En tant que contributeur citoyen, il n'est pas sensé écrire, ou
produire, n'importe quoi. Son action peut avoir des conséquences
immenses, et il est sensé le savoir, et l'assumer. Le Web 2.0 n'est pas
qu'une fenêtre ouverte sur le monde sans garde corps, et OSM n'échappe
pas à cette règle. Si on s'investit pour comprendre Potlatch, JOSM et
les outils annexes, si on passe ses soirées et ses week end à
représenter le monde autour de chez soi, ce n'est pas pour le faire par
dessus la jambe, même si c'est un loisir. Il y a un principe de
responsabilité auquel on ne peut pas échapper.
Dans ce cadre, il est normal de qualifier l'information qu'on fournit,
notamment ses sources, et de s'efforcer à tendre vers un certain niveau
de qualité, qui qu'on soit, quel que soit son niveau, à partir du moment
où on est Internaute 2.0
OSM n'aurait pas le succès qu'il a si - en majorité - les contributeurs
n'étaient pas dans cet état d'esprit. Les données seraient purement et
simplement fantaisistes et donc inexploitables.
Les contributeurs ont déjà cette notion de responsabilité. Leur demander
une ou deux métadonnées supplémentaires ne ferait que renforcer ce
sentiment, je ne pense pas qu'ils s'enfuiraient en courant, dans la
mesure où le cadrage resterait raisonnable.
Pour finir, les données non qualifiées n'ont que peu d'usages possibles.
L'importance des métadonnées est encore mal perçue, mais même ce
phénomène évolue assez vite.
Merci à tous pour vos réactions.
Serge Mang
Plus d'informations sur la liste de diffusion Talk-fr