[OSM-talk-fr] 900K utilisateurs inscrits

Philippe Verdy verdy_p at wanadoo.fr
Jeu 15 Nov 04:25:40 UTC 2012


Est-ce utile que tous les utilisateurs soient "hautement actifs" ? Le but
du projet n'est pas là mais bien d'avoir de nombreux contributeurs qui font
chacun un peu de travail, sur ce qu'ils savent et voient autour d'eux. Pour
multiplier les sources, et permettre un vrai contrôle communautaire et pas
QUE par des robots.

Le pourcentage de contributeurs hautement actifs parle peu, et il est
normal qu'il soit assez bas (il a été beaucoup trop haut). Si les inscrits
viennent pendant une semaine ou deux découvrir le projet et cartographier
ce qui est à leur porte ou les rares endroits où ils vont (là où ils voient
des choses changées ou qui manquent) ça sera très bien pour OSM !

Il me parait donc mieux pour le projet de compter les inscrits qui ont
réellement contribué quelquechose. On estime en moyenne que chacun dans le
monde n'a pas visité plus de 17 villes dans sa vie, et vit dans le
kilomètre carré qui est autour. Si on doit cartographier l'existant et pas
les endroits où on a été il y a quelques mois ou plus, ce nombre tombe à à
moins de 5 lieux, avec de nombreux lieux communs à beaucoup de monde. Cela
donne à chaque visiteur l'opportunité de cartographier 1 ou 2 lieux réduits
(chez eux d'abord, ensuite de temps en temps autour de leur travail ou
école, et quelques personnes de leur famille un peu éloignée qu'ils ne
voient pas assez souvent pour repérer ce qui change : ils savent juste à
peu près où ils vont). Après, ils vont en vacances parfois 1 fois dans
l'année, mais pas assez longtemps pour bien connaitre les lieux. Ils ne les
cartographient pas mais utilisent les cartes faites par d'autres pour
tenter de se repérer.

Si on a 1 million d'inscrits, très inégalement répartis dont plus de la
moitié en Europe, qui cartographient **au mieux** 1 km² en tout, pendant
une semaine ou deux d'activité, puis ensuite juste quelques POIs, ça fait
tout de même un paquet de données très denses en Europe, dont une moitié au
moins sera contrôlée plusieurs fois dans l'année. Il reste ensuite les très
gros contributeurs (mais qui sont obligés de faire des choix et oublient
des tas de choses qu'ils peinent à contrôler).

OSM devrait cependant croitre pour atteindre (en Europe au moins) près de
100 millions d'inscrits. On en est encore loin mais les courbes sont très
encourageantes. Ce qu'il faut mesurer c'est le temps que mettent les
nouveaux venus avant de commencer à contribuer utilement des données qu'on
garde : mesurer le nombre d'objets ou d'attributs ajoutés ou modifiés (et
non annulés par quelqu'un d'autre dans le mois qui suit et non signalé
comme "à problème" sérieux dans un outil de suivi qualité comme Osmose, en
ignorant les problèmes mineurs). Cette moyenne calculée par utilisateur
devrait être mesurée car elle indique la facilité qu'ont les nouveaux à
entrer dans le projet pour y contribuer utilement. Si cette moyenne se
dégrade, les outils sont trop peu accessibles ou la complexité
d'utilisation s'accroit avec les nouvelles règles qui viennent d'ajouter
avec le temps mais trop mal expliquées, et pas contrôlées automatiquement
par les outils utilisés : il faut développer alors les outils, comme les
groupes d'assistance et de formation.

OSM est dans la même problématique ici que Wikipédia, sauf que le projet
OSM permet beaucoup plus de traitements automatisés pour le contrôle de
qualité : il y a beaucoup moins de subjectivité possible et des tas de
recoupements croisés possibles pour les informations, avec des sources très
fiables et à jour, même si elles ne couvrent pas tout.

De plus on repère beaucoup plus facilement les aberrations sur une
représentation graphique que sur un texte à lire ; souvent les anomalies
sautent aux yeux tellement on peut faire de recoupements. Ce n'est pas
aussi facile dans OSM de glisser des infos imperceptiblement fausses, au
moins sur bon nombre d'infos essentielles (pour certaines infos dificiles à
vérifier, on peut se passer de les mettre dans OSM et utiliser plutôt les
liens de ref:* externes vers les sources que la communauté juge
relativement fiables.

Sinon les questions se poseront sur :

  - le micromapping (est-ce que le côté ouest de ce mur est peint en blanc
ou en jaune, est-il construit en parpaings ou en briques ? Est-ce que la
marche au pied de la porte ou du trottoir fait plus ou moins de 5
centimètres quand elle fait réellement juste moins de 10 cm variable selon
le point de mesure sur la marche ? Est-ce que tel magasin vend CE produit,
quel sont ses horaires d'ouverture et vais-je trouver à coup sûr la porte
ouverte si j'y vais ? Est-ce que cet arbre est bien un châtaignier comme
les autres à côté ou bien un marronnier ? Est-ce que cet abri bus est en
assez bon état pour y être à sec ? Combien de temps vais-je attendre dans
cette station de taxi selon le monde qui doit y être déjà ?)

  - sur les éléments qualitatifs très subjectifs et dépendant de celui qui
fait l'analyse (est-ce que ce vendeur est fiable ? L'accueil est-il
agréable ? Le revêtement est-il de qualité suffisante ? Le site, en
l'absence de tout classement officiel pour sa protection, est-il "joli" ou
"remarquable" ? Cette zone est-elle, selon un critère non précisé et sur
une étendue non précisée non plus, jugée "sûre" ? et toute "description"
d'un lieu en un seul paragraphe où la pertinence d'un choix arbitraire
d'éléments est difficile à établir), en l'absence de données d'un organisme
reconnu de certification ou de labellisation donnant un logo, un
certificat, un diplôme, ou un rapport d'audit vérifiable et sourçable.

  - les données qui sont valables très peu de temps (qui changent tous les
jours voire plusieurs fois par jour comme le trafic, les manifestations, ou
la survenance de certains accidents et dangers temporaires qui ne modifient
pas durablement l'infrastructure, et tout ce qui est météorologique et non
climatologique), ce qui rend difficile tout contrôle comparatif ultérieur
et oblige à des mises à jour permanentes et des retours en arrière. OSM
n'est pas taillé pour ça et il vaut mieux faire une liaison vers un service
externe spécialisé compétent dans un secteur géographique limité.

- et sur le domaine strictement privé réservés par la loi, qui n'a pas sa
place dans le projet (mais certaines automatisations sont aussi possibles
dans ce domaine : j'ai parlé déjà des listes noires non publiées, empêchant
l'introduction ou la réintroduction de certaines données, y compris celles
qui ont du être masquées suite à une plainte reçue ou à une injonction
judiciaire)
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20121115/38fd3ff7/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr