[OSM-talk-fr] Faut-il ajouter systématiquement name:fr ? Was:Outil pour ajout de name:fr ?
Philippe Verdy
verdy_p at wanadoo.fr
Mer 20 Nov 15:14:57 UTC 2013
Je n'ai jamais reçu ce message... désolé.
Maintenant préciser la langue des noms par défaut résoudra une partie des
redondances, l'autre partie ce sont les doublons des autres noms différents
du nom par défaut (ma proposition incllue aussi 'name:xx:lang=*' pour
préciser la/les autres langue(s) utilisables en plus de 'xx' déjà présent)
Parlons maintennt des redondances dans la base de données: y-a-til
réellement de la redondance si on a:
name:fr=xyz et name:en=xyz
Pas forcément si les noms des tags et leurs valeurs sont stockés sous forme
atomisée (autrement dit via une table indexée de chaines, qui les remplace
dans les tables de tags les paires chaines dans (tagname, tagvalue) par des
identifiants uniques (atomes numériques). La taille des atomes numériques
uniques peut être réduite à 64 bits en toute confiance (avant d'avoir 2
puissance 64 chaines différentes dans les valeurs de tags ou les noms de
tags il va s'écouler bien des siècles), ou bien on peut avoir 2 tables de
chaines différentes (en réduisant à 32 bits pour les noms de tags indexés à
part)
Et on peut disposer de méthodes directes pour déterminer un identifiant
unique via la table de chaines indexée (laquelle peut utiliser un tri natif
alphabétique et un indexe secondaire sur l'identifiant numérique, ou bien
l'inverse) avec une bonne fonction de hachage des chaines, rapide mais bien
distribuée comme MD5, et pour gérer les rares collisions, en multipliant ce
hachage (modulo 2^64) par un nombre premier de Mersenne (qui ne demande
qu'un décalage de 31 bits et une soustraction si on choisit 2ˆ31-1 comme
nombre premier de Mersenne), car les multiplications par des premiers ont
aussi peu de chance de rencontrer une nouvelle collision (l'autre solution
pour avoir des identifiants numériques uniques est un simple compteur, mais
il y a le problème qu'un compteur laisse des trous béants jamais
réutilisables derrière quand il y a eu de nombreuses mises à jour)
Le 20 novembre 2013 15:05, Pieren <pieren3 at gmail.com> a écrit :
> 2013/11/20 Philippe Verdy <verdy_p at wanadoo.fr>:
>
> > Je ne vois pas où est le retard, personne n'a évoqué ce que je propose.
>
> Bon, allez, parce que c'est toi et que je suis dans un bon jour:
> https://lists.openstreetmap.org/pipermail/talk-fr/2013-November/064388.html
>
> "Peut être qu'un tag qui précise la langue de name=* serait moins choquant
> pour certains,"
>
> Pieren
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20131120/bf927171/attachment.htm>
Plus d'informations sur la liste de diffusion Talk-fr