[OSM-talk-fr] Diffusion dictionnaire ?
Frédéric Rodrigo
f.rodrigo at free.fr
Mer 25 Fév 21:46:22 UTC 2009
Le mardi 24 février 2009, Etienne Chové a écrit :
> Marc SIBERT a écrit :
> > En parlant de dictionnaire, pouvez-vous le diffuser ce fameux
> > dictionnaire afin que je regarde s'il est possible de l'intégrer dans MS
> > BOT ; Envoyez-le à mon adresse personnelle par exemple ou mettez-le en
> > ligne pourquoi pas.
>
> Je mettrait ça en ligne demain. Cependant je suis contre l'intégration
> dans MS BOT. Chaque modification étant souvent unique et devant être
> vérifié avant de la faire. Sinon je les aurait faites en automatique.
>
> Pour information, les dictionnaires originaux sont les dictionnaires de
> Wiktionnary et Wikipedia et de aspell. On y rajoute un dictionnaire
> perso. Tout mot d'un name absent de ces dictionnaires lève une erreur.
> Ces mots sont rentrés à la main dans le dictionnaire perso ou dans le
> dictionnaire de corrections s'il sont faux (il en reste 14000 à trier)
> ou automatiquement s'il s'agit de problèmes d'accentuation ou de lettre
> doublé.
Il doit être possible d'aller encore plus loin, mais il faut faire très
attention. J'avais testé l'utilisation de soudex et soudex2 pour ça. Mais la
typographie la plus courtante n'est pas forcement la bonne, ou deux
typographies prochent peuvent exister toutes les deux.
http://f.rodrigo.free.fr/tmp/osm-check/typo-soundex-name.php.html
http://f.rodrigo.free.fr/tmp/osm-check/typo-soundex2-name.php.html
(attention pages non régénères depuis longtemps)
Les sources sont dipos sur la page d'accueil.
Fred
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: signature.asc
Type: application/pgp-signature
Taille: 197 octets
Desc: This is a digitally signed message part.
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20090225/9d9d995f/attachment.sig>
Plus d'informations sur la liste de diffusion Talk-fr