[OSM-talk-fr] Réflexions sur la modélisation dans osm des niveaux administratifs en france

sly (sylvain letuffe) liste at letuffe.org
Mar 24 Jan 12:14:52 UTC 2012


On mardi 24 janvier 2012, Christian Quest wrote:
> Le sujet semble sensible vu le ton de plusieurs messages...

Je le déplore d'ailleurs alors qu'on est là pour discuter, mais bon, l'humain 
aime la fight, ça doit être ça.

> Quand on travaille sur la base de données, c'est quand même plus simple de
> passer par des liens logiques entre relations pour naviguer dans les
> hiérarchies administratives, non ? 
> Les requêtes spatiales sont coûteuses en 
> calcul et c'est de pire en pire vue le nombre croissant d'objets dans les
> bases, autant s'en passer quand on peut.

Voilà qui est un la première bonne question :
- Est-ce que le programme gagne ou perd du temps

Je vais tenter d'aider de mes connaissances, mais ça reste pas facile à savoir 
tant qu'on a pas les deux formats côte à côte pour faire des tests.

Prenons un exemple, la région Ille de France, avec le modèle "logique" 
ou "surfacique" ou "relationnel" on peut répondre facilement est simplement à 
la question : quels département sont dedans. Par contre, quand je veux 
répondre à la question : quelles communes sont dedans, je dois d'abord passer 
par les départements (à moins d'inclure en subarea tous les niveaux 
administratifs supérieurs mais ça c'est juste la folie) et ça, c'est pas 
forcément simple car il faut savoir quel est le ou les niveaux entre les deux 
(admin_level=6) et ça, ça ne se devine que parce qu'on est habitué, ça n'est 
portable qu'en france, dans d'autres pays, il y aura un admin level=5 ou un 
autre tag.

Si maintenant je veux tous les bâtiments d'ille de france, c'est juste 
impossible, car il n'y a pas de relation subarea pour lier les entités 
administratives et les bâtiments. De sorte que je suis obligé d'avoir les 
deux modèles quand même, je suis donc obligé de réfléchir selon chaque besoin 
si je dois utiliser le premier ou le deuxième modèle, ça me semble pas 
jouable et pas homogène comme méthode

> Je ne vois pas trop quel problème cela pose de mélanger au sein d'une même
> relation des objets géographiques et logiques (sémantiques). 

Moi, je vois que ça fait plus de boulot pour le mappeur, et ça, je ne vois pas 
ce qui le justifie.
Si quelqu'un a "vraiment" besoin d'un modèle logique pour accélérer des 
traitements ou faire je ne sais quoi, ce qu'il y a de génial, c'est qu'il 
pourra construire sa base de donnée en partant du modèle surfacique pour 
accélérer ou pour son traitement. L'inverse n'est pas vrai.

> Les deux types d'infos sont utiles. On peut considérer que c'est redondant,
> c'est vrai, mais cette redondance permet aussi de vérifier la cohérence et
> d'assurer un contrôle de qualité.

Ça, c'est encore un autre débat, mais intéressant aussi. Je dirais quand même 
que l'informatique nous a appris que dans bien des cas, la redondance ne 
faisait que créer des problèmes, et pas en résoudre.
Et puis, d'autres bases existent déjà (le cadastre) qui permet, comme je le 
fais, de faire un peu de contrôle qualité par la comparaison. Je ne pense pas 
que ça soit utile d'avoir deux modèles dans osm dans ce seul but.
 
> Si ce mélange au sein d'une même relation est vraiment source de problème,
> devrait-on créer 2 relations, une purement logique (niveau N -> niveau N+1
> avec les sub_area et autres choses du même ordre) et une géographique pour
> avoir juste les contours ?

Selon moi, ça ne change pas grand chose. Ajouter un 
"if role différent de inner/outer then rien faire" est chiant à mettre 
partout, mais c'est quand même possible et ça coûtera moins cher au mappeur.
Mais je pense qu'avant d'en arriver là, il faut déjà se demander
subarea : pour quel usage ?

> En ayant rajouté bon nombre d'EPCI ces derniers jours, je trouve l'approche
> uniquement "frontière" trop limitée.

Voilà la deuxième bonne question :
- Est-ce que le mappeur gagne ou perd du temps

Pour les EPCI, je n'en ai pas rentré, mais j'ai bien l'impression que oui, 
c'est plus galère d'inclure les frontières que d'inclure les communes.

Et cela est à mon avis dû à une loi mathématique :
Le périmètre d'un cercle est en f(r) celui d'une surface est en f(r²)

Plus ça devient gros, et moins on aura de membre sur un modèle frontière, et 
inversement.
Donc pour les départements/commune, je pense que c'est plus simple en modèle 
frontière, pour les EPCI/communes c'est plus simple en modèle surface

Mon avis n'a pas changé, vu qu'on ne sait rien, il faut tester. Et je propose 
de sacrifier les taggeurs d'EPCI sur l'autel de la recherche et leur proposer 
d'utiliser le modèle surfacique. L'avenir nous permettra de comparer tout ce 
que ça implique (logiciel pour exporter, outil de check, facilité à rentrer, 
etc.)

J'accepte toutefois qu'on me réponde "c'est pas éthique". Car comment laisser, 
en pensant que c'est une mauvaise idée, des gens faire quelque chose qui sera 
changé par la suite et du temps perdu.

La science aussi produit ses héros


-- 
sly
qui suis-je : http://sly.letuffe.org
email perso : sylvain chez letuffe un point org




Plus d'informations sur la liste de diffusion Talk-fr