[OSM-talk-fr] expérimentations à Orange
Vincent de Chateau-Thierry
vdct at laposte.net
Sam 30 Mar 22:14:16 UTC 2013
Le 30/03/2013 22:35, Guillaume Allegre a écrit :
> Le sam. 30 mars 2013 à 21:45 +0100, Vincent de Chateau-Thierry a écrit :
>
>>> Ensuite : ref:orange : là, je pense qu'on a un problème à régler. "orange" n'est pas suffisamment
>>> distinctif. Si toutes les communes du monde se mettent à utiliser le même schéma, on va multiplier
>>> les conflits. Comment régler ça ?
>>>
>>
>> Pour éviter d'avoir 36.000 tags ref:* distincts à terme (on peut
>> rêver), je verrais plutôt un schéma générique sur 2 tags :
>>
>> source=* (rien de nouveau ici)
>> ref:source=* ou source:internal_id ou toute autre formulation pour
>> dire la même chose : mentionner l'identifiant unique utilisé par le
>> fournisseur.
>>
>> Dans l'exemple du way :
>> source="Mairie d'Orange 2012"
>> ref:source=84087V999999
>>
>> Après tout, il ne s'agit pas d'un tag ref pour l'objet, que tout un
>> chacun pourrait trouver sur le terrain, mais d'un tag ref qui
>> n'existe que parce qu'une certaine source a été utilisée pour
>> l'objet.
>
> Oui, mais cette façon de faire limite les possibilités d'édition ultérieures :
> - un objet pourrait avoir plusieurs ref (par exemple un ref:insee et un ref:FR:<code-commune>)
> - un objet peut avoir plusieurs sources : un SIG territorial à l'origine, puis une retouche par Bing
> ou par le cadastre
> et le source=Mairie d'Orange irait mieux sur le changeset
> Du coup, ref:source me semble trop fragile.
> Je pense que ref:FR:<code insee commune> comme proposé par Philippe Verdy est le plus sûr.
>
Avec le schéma ref:FR:<code insee commune> on pourrait se retrouver avec
autant de clés que de communes, toutes signifiant grosso-modo la même
chose : "cette clé a pour valeur une référence interne à la commune
XXX". À l'extrême, 36.000 communes, 36.000 clés ? Je sais bien qu'on
n'en arrivera pas là, je pousse juste la logique au bout. Et côté
modélisation, autant de clés distinctes qui disent toutes la même chose,
je trouve que ça fait beaucoup. Et dans ce scenario catastrophe, imagine
le schéma de réutilisation, dans un modèle mis à plat comme le schéma
standard d'osm2pgsql : 36.000 colonnes rien que pour la source...
Et c'est aussi, à sa manière, fragile. Quid de plusieurs sources issues
de la même ville (on a facilement le cas sur les grandes villes) : la
source des espaces verts, celle de la voirie, etc. Pour peu que les
plages de valeurs se recoupent, le tag ref:FR:<insee> n'a plus de
valeurs uniques dans la même ville, le bénéfice de tracer la source est
perdu.
Ma proposition sur 2 tags a pour objectif, au moins, d'éviter la
multiplicité des clés signifiant toutes la même chose. Je suis d'accord
sur le fait que ça ne gère pas le multi-sources. Mais en même temps,
est-ce que sur ces objets on n'est pas, quasi par principe, face à du
mono-source ? Des objets issus d'un SIG communal, tracés comme tels,
sont potentiellement maintenus côté OSM grâce au lien avec la base
source, justement. Et si besoin, rien n'empêche d'aller un cran plus fin
dans le détail, en sourçant chaque clé plutôt que l'objet dans sa
globalité. On a déjà des paquets de source:addr:postcode et des
source:ref:INSEE, sur le même principe.
vincent
Plus d'informations sur la liste de diffusion Talk-fr