[OSM-talk-fr] Fwd: Invitation au Datalift Camp

Charles Nepote charles at nepote.org
Mer 12 Sep 16:15:39 UTC 2012


Le 12/09/2012 17:20, Emilie Laffray a écrit :
>
> Bonjour,
>
> Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été 
> évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que 
> l'évolution vers des triplets et réf soit viable toutefois.
>
Qu'est-ce qui te fait dire ça ? Ton avis m'intéresse.


> Je serai curieuse de savoir comment l'adressage des données se fait 
> puisque les données dans Osm ne sont pas fixes en soi.
>
C'est est un problème par exemple dans dbpedia, que le groupe dbpedia 
lite a résolu : "Unlike dbpedia is it uses stable Wikipedia pageIds in 
its URIs to attempt to mitigate the problems of article titles changing 
over time. If the title of a Wikipedia page changes, the dbpedia lite 
URI will stay the same. This makes it safer to store dbpedia lite 
identifiers in your own database." http://dbpedialite.org/ (2e paragraphe).
Je ne connais pas assez bien le modèle de données d'OSM mais je pensais 
que chaque objet avait un ID qui lui ne change pas, non ? Ex : 
http://linkedgeodata.org/page/triplify/way27743320

ChN

> Emilie laffray
>
> On Sep 12, 2012 11:14 PM, "Charles Nepote" <charles at nepote.org 
> <mailto:charles at nepote.org>> wrote:
>
>     Bonjour,
>
>     Dans le cadre de mon travail nous organisons cet événement
>     concernant le linked data web et la plateforme d'enrichissement de
>     données Datalift. La communauté OSM est concernée puisqu'elle
>     fournit aujourd'hui l'un des plus grand jeux de données du linked
>     data web avec 20 milliards de triplets : http://linkedgeodata.org/
>     (même si le service n'en est qu'à ses débuts).
>     Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter
>     de ces technos pour des développements plus simples et plus rapide
>     : par exemple, des croisements d'OSM avec DBpedia (extraction de
>     wikipedia sous forme de données).
>
>     Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous
>     n'avons pas beaucoup de place et nous souhaitons privilégier une
>     certaine diversité d'acteurs, donc je compte limiter les inscrits
>     OSM à 2-3 places max. La cible de l'événement est plutôt les
>     producteurs de données et principalement open data : il y aura
>     donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc.
>
>     CharlesNepote
>
>
>     -------- Message original --------
>     Sujet: 	Invitation au Datalift Camp
>     Date : 	Wed, 12 Sep 2012 12:22:44 +0000 (UTC)
>     De : 	Charles Nepote <charles.nepote at fing.org>
>     <mailto:charles.nepote at fing.org>
>
>     	
>     Pour : 	Charles Nepote <charles.nepote at fing.org>
>     <mailto:charles.nepote at fing.org>
>
>
>
>       Datalift Camp, Paris
>
>
>         /Valorisez vos données tout en vous formant au web sémantique/
>
>     _Une journée de formation-action, à choisir entre le mardi 9 ou le
>     mercredi 10 octobre 2012 _
>
>     //
>
>     /« Comment intéresser des créateurs à la réutilisation de nos
>     données alors qu'elles ne sont compatibles avec rien d'existant ?
>     ... Comment inciter ce développeur à adapter son application à
>     notre territoire/notre domaine ? ... Des réutilisateurs se
>     plaignent régulièrement que le croisement de données est un
>     travail long et fastidieux, comment leur faciliter la vie ? ...
>     Nous avons publié nos budgets avec une vraie volonté de
>     transparence, mais tout le monde nous dit qu'il est impossible de
>     les comparer avec ceux du territoire d'à côté ! ... Pour cette
>     base de données cruciale nous recherchons une liste de référence
>     des espèces végétales de ce territoire : où la trouver et comment
>     voir si elle évolue ? ... La liste de nos élus sur nos différents
>     supports numériques n'est jamais à jour, comment optimiser ça ? / /»/
>
>     Le web des données -- ou web sémantique -- est la *promesse d'un
>     web centré sur les données*, un web où les données de toutes
>     formes et de tous acteurs se trouvent normalisées, identifiées
>     sans ambiguïté et reliées les unes aux autres. Un web où la
>     création de nouveaux services, de nouveaux usages, de nouveaux
>     croisements des données est grandement simplifié.
>
>     Cette *promesse devient progressivement réalité*. Aujourd'hui
>     plusieurs dizaines d'organisations dans le monde utilisent ces
>     technologies qui créent un véritable saut qualitatif dans la
>     gestion et valorisation des données -- on parle de "données 5
>     étoiles
>     <http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles>".
>     Comment font-elles ? En combien de temps ? Avec quels résultats ?
>     Est-il possible de produire des données "5 étoiles" en quelques
>     heures ? sur la base de mes fichiers CSV ? pour quels gains ?
>
>     Depuis environ un an, une équipe constituée de quelques uns des
>     meilleurs spécialistes français du web sémantique, s'est attelée à
>     la tâche au sein d’un projet de recherche ANR.
>
>     Datalift <http://datalift.org/>, c'est son nom, est une plateforme
>     open source qui élève vos données brutes structurées (bases de
>     données, CSV, XML, SHP, etc.) vers des données sémantiques
>     interconnectées.
>
>     A l'heure où la plateforme est désormais fonctionnelle, l’équipe
>     Datalift vous propose une *journée de formation-action avec deux
>     objectifs forts* <http://datalift.eventvride.fr/>.
>
>     *1. Comprendre*
>
>     *Comment les technos du web sémantique peuvent-elles booster vos
>     données  ?*
>
>      *
>
>         donner un identifiant à chaque donnée lui donne de la valeur :
>         comment ? Pourquoi ?
>
>      *
>
>         normaliser les propriétés et valeurs de chaque donnée pour
>         augmenter leur interopérabilité
>
>      *
>
>         comment réaliser des croisements entre vos données et celles
>         d'autres acteurs  ?
>
>      *
>
>         comment toutes ces techniques, au final, contribuent à
>         simplifier au maximum la vie des développeurs
>
>     En introduction et, par la pratique, tout au long de la journée,
>     des experts du web des données vous amènent à comprendre chacun
>     des bénéfices de ces technologies.
>
>     *2. Agir*
>
>     *A l'aide de l'outil open source Datalift, boostez vous-même vos
>     propres jeux de données *
>
>      *
>
>         donner un identifiant à toutes vos données
>
>      *
>
>         les convertir dans le format standard du web sémantique (RDF)
>
>      *
>
>         les croiser avec d'autres jeux de données, dont des jeux de
>         données de référence sélectionnés par l'équipe Datalift
>
>      *
>
>         les publier sur internet en quelques clics : chaque donnée
>         devient ainsi accessible depuis un navigateur et vos jeux de
>         données sont interrogeables via l'API standard du web
>         sémantique (SPARQL).
>
>     A l'issue de cette journée, vous repartez avec certains de vos
>     jeux de données enrichis et désormais prêts pour une valorisation
>     plus complète.
>
>     Au-delà, l'équipe Datalift peut vous accompagner pour mettre ces
>     données en production ou bien le réaliser pour vous.
>
>     *Valorisez dans la foulée vos données liftées : le hackathon
>     "données 5 étoiles"*
>
>     Fin novembre, faisant suite à cette formation-action, l'équipe
>     Datalift organisera un « hackathon » – moment créatif de
>     prototypage d'applications – pour valoriser notamment les données
>     que vous aurez produites. Cet événement ouvert et dédié aux
>     réutilisateurs, vous offre la possibilité de valoriser vos données
>     liftées et d'aller plus loin dans la compréhension des usages
>     rendus possibles.
>
>     *Les modalités concrètes *
>
>     *Pour qui ?*
>
>      *
>
>         en priorité, les producteurs de données : territoires engagés
>         dans l'open data, acteurs publics nationaux, associations,
>         entreprises, scientifiques et acteurs du monde de la
>         recherche, acteurs de la culture, etc.
>
>      *
>
>         les éditeurs/fournisseurs de plateformes de gestion de données
>         (dont plateformes open data)
>
>      *
>
>         les principaux experts, personnalités et prescripteurs de
>         l'open data en France.
>
>     Il n'est pas nécessaire d'avoir un profil de développeur ni même
>     de connaissances techniques sur le web sémantique.
>
>     *Où et quand ?*
>
>     Localisé à Paris intra-muros (précisé ultérieurement), l’événement
>     rassemble environ 80 participants au total. L'événement se déroule
>     sur _une seule journée_ mais vous avez le _choix de votre jour_ :
>     mardi 9 octobre *ou* mercredi 10 octobre.
>
>     *Déroulé.*
>
>     09h30 : accueil.
>
>     10h00 : Le web sémantique : bénéfices et perspectives ; brève
>     présentation de la plateforme Datalift ; questions.
>
>     11h15 : Phase collective d'évaluation des jeux de données que vous
>     souhaiteriez enrichir : faisabilité possible dans le cadre de la
>     journée, croisements avec des jeux de données de référence,
>     croisements avec d'autres partenaires, etc.
>
>     12h15 : pause déjeuner.
>
>     13h30 : Pratique : les participants se répartissent en petits
>     groupes (3-6 personnes) où chaque participant, encadré par les
>     experts Datalift, met les mains dans le cambouis -- si possible
>     avec ses propres données.
>
>     17h00 : restitution de 4 minutes par groupe : qu'a-t-on réalisé ?
>     quelles opportunités et difficultés identifiées ?
>
>     17h30 : Fin de la session.
>
>     *De quoi ai-je besoin pour venir ? *
>
>      *
>
>         s'inscrire impérativement – l'entrée est libre et gratuite :
>         http://dataliftcamp.eventbrite.fr/
>
>      *
>
>         si possible venir avec son PC portable pour la pratique ; la
>         connexion internet via wifi est prévue sur place
>
>      *
>
>         éventuellement, commencer à regarder vos jeux de données et
>         réfléchir à ceux qui auraient le plus de sens pour vous
>
>      *
>
>         les repas ne sont pas pris en charge mais, si vous le
>         souhaitez, un déjeuner de groupe est proposé (~15-20€)
>
>     *Les partenaires de Datalift*
>
>     Atos Origin, EURECOM, l'IGN, INRIA (équipes EXMO et WIMIX),
>     l'INSEE, le LIRMM, Mondeca et la Fing.
>
>     http://datalift.org/
>
>
>
>
>
>     _______________________________________________
>     Talk-fr mailing list
>     Talk-fr at openstreetmap.org <mailto:Talk-fr at openstreetmap.org>
>     http://lists.openstreetmap.org/listinfo/talk-fr
>

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20120912/025849a9/attachment.htm>


Plus d'informations sur la liste de diffusion Talk-fr