[OSM-talk-fr] Fwd: Invitation au Datalift Camp
Charles Nepote
charles at nepote.org
Mer 12 Sep 14:14:02 UTC 2012
Bonjour,
Dans le cadre de mon travail nous organisons cet événement concernant le
linked data web et la plateforme d'enrichissement de données Datalift.
La communauté OSM est concernée puisqu'elle fournit aujourd'hui l'un des
plus grand jeux de données du linked data web avec 20 milliards de
triplets : http://linkedgeodata.org/ (même si le service n'en est qu'à
ses débuts).
Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter de
ces technos pour des développements plus simples et plus rapide : par
exemple, des croisements d'OSM avec DBpedia (extraction de wikipedia
sous forme de données).
Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous n'avons
pas beaucoup de place et nous souhaitons privilégier une certaine
diversité d'acteurs, donc je compte limiter les inscrits OSM à 2-3
places max. La cible de l'événement est plutôt les producteurs de
données et principalement open data : il y aura donc beaucoup d'acteurs
publics territoriaux, l'IGN, l'INSEE, etc.
CharlesNepote
-------- Message original --------
Sujet: Invitation au Datalift Camp
Date : Wed, 12 Sep 2012 12:22:44 +0000 (UTC)
De : Charles Nepote <charles.nepote at fing.org>
Pour : Charles Nepote <charles.nepote at fing.org>
Datalift Camp, Paris
/Valorisez vos données tout en vous formant au web sémantique/
_Une journée de formation-action, à choisir entre le mardi 9 ou le
mercredi 10 octobre 2012 _
//
/« Comment intéresser des créateurs à la réutilisation de nos données
alors qu'elles ne sont compatibles avec rien d'existant ? ... Comment
inciter ce développeur à adapter son application à notre
territoire/notre domaine ? ... Des réutilisateurs se plaignent
régulièrement que le croisement de données est un travail long et
fastidieux, comment leur faciliter la vie ? ... Nous avons publié nos
budgets avec une vraie volonté de transparence, mais tout le monde nous
dit qu'il est impossible de les comparer avec ceux du territoire d'à
côté ! ... Pour cette base de données cruciale nous recherchons une
liste de référence des espèces végétales de ce territoire : où la
trouver et comment voir si elle évolue ? ... La liste de nos élus sur
nos différents supports numériques n'est jamais à jour, comment
optimiser ça ? / /»/
Le web des données -- ou web sémantique -- est la *promesse d'un web
centré sur les données*, un web où les données de toutes formes et de
tous acteurs se trouvent normalisées, identifiées sans ambiguïté et
reliées les unes aux autres. Un web où la création de nouveaux services,
de nouveaux usages, de nouveaux croisements des données est grandement
simplifié.
Cette *promesse devient progressivement réalité*. Aujourd'hui plusieurs
dizaines d'organisations dans le monde utilisent ces technologies qui
créent un véritable saut qualitatif dans la gestion et valorisation des
données -- on parle de "données 5 étoiles
<http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles>".
Comment font-elles ? En combien de temps ? Avec quels résultats ? Est-il
possible de produire des données "5 étoiles" en quelques heures ? sur la
base de mes fichiers CSV ? pour quels gains ?
Depuis environ un an, une équipe constituée de quelques uns des
meilleurs spécialistes français du web sémantique, s'est attelée à la
tâche au sein d’un projet de recherche ANR.
Datalift <http://datalift.org/>, c'est son nom, est une plateforme open
source qui élève vos données brutes structurées (bases de données, CSV,
XML, SHP, etc.) vers des données sémantiques interconnectées.
A l'heure où la plateforme est désormais fonctionnelle, l’équipe
Datalift vous propose une *journée de formation-action avec deux
objectifs forts* <http://datalift.eventvride.fr/>.
*1. Comprendre*
*Comment les technos du web sémantique peuvent-elles booster vos données ?*
*
donner un identifiant à chaque donnée lui donne de la valeur :
comment ? Pourquoi ?
*
normaliser les propriétés et valeurs de chaque donnée pour augmenter
leur interopérabilité
*
comment réaliser des croisements entre vos données et celles
d'autres acteurs ?
*
comment toutes ces techniques, au final, contribuent à simplifier au
maximum la vie des développeurs
En introduction et, par la pratique, tout au long de la journée, des
experts du web des données vous amènent à comprendre chacun des
bénéfices de ces technologies.
*2. Agir*
*A l'aide de l'outil open source Datalift, boostez vous-même vos propres
jeux de données *
*
donner un identifiant à toutes vos données
*
les convertir dans le format standard du web sémantique (RDF)
*
les croiser avec d'autres jeux de données, dont des jeux de données
de référence sélectionnés par l'équipe Datalift
*
les publier sur internet en quelques clics : chaque donnée devient
ainsi accessible depuis un navigateur et vos jeux de données sont
interrogeables via l'API standard du web sémantique (SPARQL).
A l'issue de cette journée, vous repartez avec certains de vos jeux de
données enrichis et désormais prêts pour une valorisation plus complète.
Au-delà, l'équipe Datalift peut vous accompagner pour mettre ces données
en production ou bien le réaliser pour vous.
*Valorisez dans la foulée vos données liftées : le hackathon "données 5
étoiles"*
Fin novembre, faisant suite à cette formation-action, l'équipe Datalift
organisera un « hackathon » – moment créatif de prototypage
d'applications – pour valoriser notamment les données que vous aurez
produites. Cet événement ouvert et dédié aux réutilisateurs, vous offre
la possibilité de valoriser vos données liftées et d'aller plus loin
dans la compréhension des usages rendus possibles.
*Les modalités concrètes *
*Pour qui ?*
*
en priorité, les producteurs de données : territoires engagés dans
l'open data, acteurs publics nationaux, associations, entreprises,
scientifiques et acteurs du monde de la recherche, acteurs de la
culture, etc.
*
les éditeurs/fournisseurs de plateformes de gestion de données (dont
plateformes open data)
*
les principaux experts, personnalités et prescripteurs de l'open
data en France.
Il n'est pas nécessaire d'avoir un profil de développeur ni même de
connaissances techniques sur le web sémantique.
*Où et quand ?*
Localisé à Paris intra-muros (précisé ultérieurement), l’événement
rassemble environ 80 participants au total. L'événement se déroule sur
_une seule journée_ mais vous avez le _choix de votre jour_ : mardi 9
octobre *ou* mercredi 10 octobre.
*Déroulé.*
09h30 : accueil.
10h00 : Le web sémantique : bénéfices et perspectives ; brève
présentation de la plateforme Datalift ; questions.
11h15 : Phase collective d'évaluation des jeux de données que vous
souhaiteriez enrichir : faisabilité possible dans le cadre de la
journée, croisements avec des jeux de données de référence, croisements
avec d'autres partenaires, etc.
12h15 : pause déjeuner.
13h30 : Pratique : les participants se répartissent en petits groupes
(3-6 personnes) où chaque participant, encadré par les experts Datalift,
met les mains dans le cambouis -- si possible avec ses propres données.
17h00 : restitution de 4 minutes par groupe : qu'a-t-on réalisé ?
quelles opportunités et difficultés identifiées ?
17h30 : Fin de la session.
*De quoi ai-je besoin pour venir ? *
*
s'inscrire impérativement – l'entrée est libre et gratuite :
http://dataliftcamp.eventbrite.fr/
*
si possible venir avec son PC portable pour la pratique ; la
connexion internet via wifi est prévue sur place
*
éventuellement, commencer à regarder vos jeux de données et
réfléchir à ceux qui auraient le plus de sens pour vous
*
les repas ne sont pas pris en charge mais, si vous le souhaitez, un
déjeuner de groupe est proposé (~15-20€)
*Les partenaires de Datalift*
Atos Origin, EURECOM, l'IGN, INRIA (équipes EXMO et WIMIX), l'INSEE, le
LIRMM, Mondeca et la Fing.
http://datalift.org/
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20120912/fca9d7a6/attachment.htm>
Plus d'informations sur la liste de diffusion Talk-fr