[OSM-talk-fr] "Mechanical Edit" : le mal ( était : peut-il guérir le mal ?)

Philippe Verdy verdy_p at wanadoo.fr
Mar 20 Jan 18:19:09 UTC 2015


Attention à ce que compte Osmose. Il ne détecte que l'auteur de la dernière
version d'un objet qui 'a pu être modifié que sur certains des tags sans
même toucher à la géométrie ou la contrôler; certains objets sont laissés
tels quels et il faut remonter l'historique pour savoir ce qui a été fait
avant, mais ça Osmose ne sait pas remonter à la source de qui a fait
réellement l'erreur signalée.

D'autre part il y a des erreurs comptées tout à fait normales quand la
modification a consisté à ajouter un FIXME sur ce qui est incomplet. Il
vaut mieux une donnée incomplète que mettre une donnée arbitraire
"corrigeant" l'erreur Osmose (par exemple un segment destiné à fermer un
objet dont on ne connait pas certains détail locaux.

En fait tous ceux qui font beaucoup de travail sur OSM ont des paquets
d'erreurs qui leur sont attribués par Osmose qui ne fait pas dans le détail
et ne tient pas compte même de ce que cette modif a réellement corrigé
(très souvent cela corrige un paquet d'erreurs laissées par d'autres mais
certaines ne le sont pas).

On ne peut pas s'attendre non plus à ce que ceux qui font des erreurs les
corrige toutes eux-mêmes. D'ailleurs s on regarde un peu mieux on voit
aussi que les bots du DWG laissent un énorme paquet d'erreurs derrière eux
(notamment dans les données qu'ils suppriment en masse même à tord car
leurs requêtes sont souvent insuffisantes pour savoir réellement ce qu'ils
suppriment, ils oublient souvent de regarder les autres tags pour lesquels
les données supprimées étaient nécessaires et tout à fait justes et même
pas concernées par les raisons données par le DWG).

Bref méfiance avec ces statistiques qu'il ne faut pas lire à la lettre (une
meilleure statistique est de regarder le rapport entre le nombre de modifs
NON marquées en erreur et celles qui le sont et voir comment évolue ce taux
avec le temps : parfois il y a des hausses brutales mais c'est la plupart
du temps dû soit à l'ajout de nouvelles règles ajoutées dans Osmose, pas
toujours justes dans un premier jet car pas assez filtrées pour tenir
compte de certaines exceptions normales oubliées, ou parce qu'il y a eu une
nouvelle façon de faire, ou bien un apport massif, ou le passage d'un bot
qui a pu rompre un objet sur ces règles; qui sera ensuite modifié sur tout
autre chose que ce qui est signalé par ce que ce n'était pas l'objet du
changeset)

On fait de notre mieux pour tenter de tenir nos statistiques basses; mais
il est impossible de les corriger sans infos supplémentaires quand au
départ les données étaient justes et correctement marquées en FIXME quand
elles étaient insuffisantes ou ambiguës à la source.

Enfin certaines erreurs d'Osmose n'en sont pas, ce sont souvent juste des
alertes sur des erreurs courantes fortement probables mais ayant des
exceptions. On peut toujours tenter de les signaler en faux-positif mais en
pratique on ne le fait pas s'il y a effectivement des FIXME ou des notes
expliquant pourquoi ce n'est pas une erreur mais qu'il manque des données.

Et puis on ne passe pas sa vie non plus à surveiller Osmose sans arrêt;
même juste pour le niveau 1 de "gravité" tel que la prétendue erreur "deux
noms" qui n'en est souvent pas une mais juste dûe à la présence de certains
caractères (et pas seulement un point-virgule mais aussi un simple "/"
quand il y a bien deux noms en deux langues ou qui est le nom officiel
d'une enseigne commerciale, ou un "+" qui fait partie du nom tel que les
"P+R ..." pour les noms de nombreux parkings en France, Allemagne, Suisse;
Belgique...).

Osmose applique juste une heuristique pour signaler ce qui est souvent une
erreur mais pas toujours (et même si on signale comme faux positif, cela
revient plus tard à la première modification sui suit de l'objet signalé
car Osmose ne garde les faux positifs QUE pour la version qui a été
signalée mais pas les suivantes).

Voyez Osmose comme un assistant utile mais heureusement il ne donne pas des
ordres sinon il ferait lui-même les modifs automatiques par un bot et
n'aurait pas besoin de les lister pour un contrôle humain (même pour les
prétendue fautes d'orthographes qui n'en sont pas toujours avec des fausses
homonymies ou homophonies). Ce que fait Osmose c'est juste poser des
questions, il n'y répond pas même s'il **suggère** des corrections
possibles.


Le 20 janvier 2015 14:08, Art Penteur <art.penteur at gmail.com> a écrit :

> Oui, pour l'instant je n'ai fait que quelques signalements, sans
> l'aide d'un programme. Je n'ai eu que des retours courtois, et les
> bureaux concernés sont corrigés.
>
> C'est peut-être aussi bien de rester entre humains, après tout.
>
> Et il n'y a a que ceux qui ne font rien qui n'ont pas d'erreur à
> corriger ! (dixit Art Penteur à qui Osmose associe 6258 erreurs !)
>
> Art.
>
>
> Le 20 janvier 2015 09:53, Yves Pratter <yves.pratter at gmail.com> a écrit :
> >
> >> Le 19 janv. 2015 à 21:41, Art Penteur <art.penteur at gmail.com> a écrit :
> >
> >> Personnellement, je suis pour [les éditions (semi) automatiques].
> > itou
> >
> >> .Certaines erreurs signalées par Osmose m'énervent : Espace en double,
> ou au début où à la fin de name.
> > +1
> > Je ne sais pas combien il en reste à intégrer, mais serait-il possible
> de nettoyer le fichier de données source qu’utilise Osmose ?
> > J’ai intégré quelques bureaux de poste et quelques gares, mais je n’ai
> pas pensé à corriger la casse du nom.
> >
> >> Pour en revenir aux bureaux de poste, je pense qu'il y en a un peu trop
> pour faire du cas pas cas.
> > +1
> >
> >
> >>
> >> et il y en a d'autres (nombre inconnu). C'est pour ça que je propose
> >> de passer à l'automatisation, soit du mail de sensibilisation, soit de
> >> la correction.
> > Attention à la forme ;-)
> >
> >> Allez, je peux essayer quelques messages spécifiques, pour voir si ça
> >> donne quelque chose.
> > J’ai eu le passage du père « bot » , à moins que c’était Arpenteur en
> personne ?
> >
> > —
> > Yves
> >
> >
> > _______________________________________________
> > Talk-fr mailing list
> > Talk-fr at openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-fr
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20150120/054579cd/attachment-0001.html>


Plus d'informations sur la liste de diffusion Talk-fr