[OSM-talk-fr] Fwd: Invitation au Datalift Camp
Charles Nepote
charles at nepote.org
Mer 12 Sep 16:15:39 UTC 2012
Le 12/09/2012 17:20, Emilie Laffray a écrit :
>
> Bonjour,
>
> Très intéressant. J'aurai aimé venir. C'est Ubuntu sujet qui avait été
> évoqué lors de glam wiki 2010. Je ne suis juste pas sûre que
> l'évolution vers des triplets et réf soit viable toutefois.
>
Qu'est-ce qui te fait dire ça ? Ton avis m'intéresse.
> Je serai curieuse de savoir comment l'adressage des données se fait
> puisque les données dans Osm ne sont pas fixes en soi.
>
C'est est un problème par exemple dans dbpedia, que le groupe dbpedia
lite a résolu : "Unlike dbpedia is it uses stable Wikipedia pageIds in
its URIs to attempt to mitigate the problems of article titles changing
over time. If the title of a Wikipedia page changes, the dbpedia lite
URI will stay the same. This makes it safer to store dbpedia lite
identifiers in your own database." http://dbpedialite.org/ (2e paragraphe).
Je ne connais pas assez bien le modèle de données d'OSM mais je pensais
que chaque objet avait un ID qui lui ne change pas, non ? Ex :
http://linkedgeodata.org/page/triplify/way27743320
ChN
> Emilie laffray
>
> On Sep 12, 2012 11:14 PM, "Charles Nepote" <charles at nepote.org
> <mailto:charles at nepote.org>> wrote:
>
> Bonjour,
>
> Dans le cadre de mon travail nous organisons cet événement
> concernant le linked data web et la plateforme d'enrichissement de
> données Datalift. La communauté OSM est concernée puisqu'elle
> fournit aujourd'hui l'un des plus grand jeux de données du linked
> data web avec 20 milliards de triplets : http://linkedgeodata.org/
> (même si le service n'en est qu'à ses débuts).
> Par ailleurs, de nombreux outils dérivés d'OSM pourraient profiter
> de ces technos pour des développements plus simples et plus rapide
> : par exemple, des croisements d'OSM avec DBpedia (extraction de
> wikipedia sous forme de données).
>
> Ceux qui s'intéressent à ce thème peuvent s'inscrire mais nous
> n'avons pas beaucoup de place et nous souhaitons privilégier une
> certaine diversité d'acteurs, donc je compte limiter les inscrits
> OSM à 2-3 places max. La cible de l'événement est plutôt les
> producteurs de données et principalement open data : il y aura
> donc beaucoup d'acteurs publics territoriaux, l'IGN, l'INSEE, etc.
>
> CharlesNepote
>
>
> -------- Message original --------
> Sujet: Invitation au Datalift Camp
> Date : Wed, 12 Sep 2012 12:22:44 +0000 (UTC)
> De : Charles Nepote <charles.nepote at fing.org>
> <mailto:charles.nepote at fing.org>
>
>
> Pour : Charles Nepote <charles.nepote at fing.org>
> <mailto:charles.nepote at fing.org>
>
>
>
> Datalift Camp, Paris
>
>
> /Valorisez vos données tout en vous formant au web sémantique/
>
> _Une journée de formation-action, à choisir entre le mardi 9 ou le
> mercredi 10 octobre 2012 _
>
> //
>
> /« Comment intéresser des créateurs à la réutilisation de nos
> données alors qu'elles ne sont compatibles avec rien d'existant ?
> ... Comment inciter ce développeur à adapter son application à
> notre territoire/notre domaine ? ... Des réutilisateurs se
> plaignent régulièrement que le croisement de données est un
> travail long et fastidieux, comment leur faciliter la vie ? ...
> Nous avons publié nos budgets avec une vraie volonté de
> transparence, mais tout le monde nous dit qu'il est impossible de
> les comparer avec ceux du territoire d'à côté ! ... Pour cette
> base de données cruciale nous recherchons une liste de référence
> des espèces végétales de ce territoire : où la trouver et comment
> voir si elle évolue ? ... La liste de nos élus sur nos différents
> supports numériques n'est jamais à jour, comment optimiser ça ? / /»/
>
> Le web des données -- ou web sémantique -- est la *promesse d'un
> web centré sur les données*, un web où les données de toutes
> formes et de tous acteurs se trouvent normalisées, identifiées
> sans ambiguïté et reliées les unes aux autres. Un web où la
> création de nouveaux services, de nouveaux usages, de nouveaux
> croisements des données est grandement simplifié.
>
> Cette *promesse devient progressivement réalité*. Aujourd'hui
> plusieurs dizaines d'organisations dans le monde utilisent ces
> technologies qui créent un véritable saut qualitatif dans la
> gestion et valorisation des données -- on parle de "données 5
> étoiles
> <http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes#Les_donn.C3.A9es_ouvertes_5_.C3.A9toiles>".
> Comment font-elles ? En combien de temps ? Avec quels résultats ?
> Est-il possible de produire des données "5 étoiles" en quelques
> heures ? sur la base de mes fichiers CSV ? pour quels gains ?
>
> Depuis environ un an, une équipe constituée de quelques uns des
> meilleurs spécialistes français du web sémantique, s'est attelée à
> la tâche au sein d’un projet de recherche ANR.
>
> Datalift <http://datalift.org/>, c'est son nom, est une plateforme
> open source qui élève vos données brutes structurées (bases de
> données, CSV, XML, SHP, etc.) vers des données sémantiques
> interconnectées.
>
> A l'heure où la plateforme est désormais fonctionnelle, l’équipe
> Datalift vous propose une *journée de formation-action avec deux
> objectifs forts* <http://datalift.eventvride.fr/>.
>
> *1. Comprendre*
>
> *Comment les technos du web sémantique peuvent-elles booster vos
> données ?*
>
> *
>
> donner un identifiant à chaque donnée lui donne de la valeur :
> comment ? Pourquoi ?
>
> *
>
> normaliser les propriétés et valeurs de chaque donnée pour
> augmenter leur interopérabilité
>
> *
>
> comment réaliser des croisements entre vos données et celles
> d'autres acteurs ?
>
> *
>
> comment toutes ces techniques, au final, contribuent à
> simplifier au maximum la vie des développeurs
>
> En introduction et, par la pratique, tout au long de la journée,
> des experts du web des données vous amènent à comprendre chacun
> des bénéfices de ces technologies.
>
> *2. Agir*
>
> *A l'aide de l'outil open source Datalift, boostez vous-même vos
> propres jeux de données *
>
> *
>
> donner un identifiant à toutes vos données
>
> *
>
> les convertir dans le format standard du web sémantique (RDF)
>
> *
>
> les croiser avec d'autres jeux de données, dont des jeux de
> données de référence sélectionnés par l'équipe Datalift
>
> *
>
> les publier sur internet en quelques clics : chaque donnée
> devient ainsi accessible depuis un navigateur et vos jeux de
> données sont interrogeables via l'API standard du web
> sémantique (SPARQL).
>
> A l'issue de cette journée, vous repartez avec certains de vos
> jeux de données enrichis et désormais prêts pour une valorisation
> plus complète.
>
> Au-delà, l'équipe Datalift peut vous accompagner pour mettre ces
> données en production ou bien le réaliser pour vous.
>
> *Valorisez dans la foulée vos données liftées : le hackathon
> "données 5 étoiles"*
>
> Fin novembre, faisant suite à cette formation-action, l'équipe
> Datalift organisera un « hackathon » – moment créatif de
> prototypage d'applications – pour valoriser notamment les données
> que vous aurez produites. Cet événement ouvert et dédié aux
> réutilisateurs, vous offre la possibilité de valoriser vos données
> liftées et d'aller plus loin dans la compréhension des usages
> rendus possibles.
>
> *Les modalités concrètes *
>
> *Pour qui ?*
>
> *
>
> en priorité, les producteurs de données : territoires engagés
> dans l'open data, acteurs publics nationaux, associations,
> entreprises, scientifiques et acteurs du monde de la
> recherche, acteurs de la culture, etc.
>
> *
>
> les éditeurs/fournisseurs de plateformes de gestion de données
> (dont plateformes open data)
>
> *
>
> les principaux experts, personnalités et prescripteurs de
> l'open data en France.
>
> Il n'est pas nécessaire d'avoir un profil de développeur ni même
> de connaissances techniques sur le web sémantique.
>
> *Où et quand ?*
>
> Localisé à Paris intra-muros (précisé ultérieurement), l’événement
> rassemble environ 80 participants au total. L'événement se déroule
> sur _une seule journée_ mais vous avez le _choix de votre jour_ :
> mardi 9 octobre *ou* mercredi 10 octobre.
>
> *Déroulé.*
>
> 09h30 : accueil.
>
> 10h00 : Le web sémantique : bénéfices et perspectives ; brève
> présentation de la plateforme Datalift ; questions.
>
> 11h15 : Phase collective d'évaluation des jeux de données que vous
> souhaiteriez enrichir : faisabilité possible dans le cadre de la
> journée, croisements avec des jeux de données de référence,
> croisements avec d'autres partenaires, etc.
>
> 12h15 : pause déjeuner.
>
> 13h30 : Pratique : les participants se répartissent en petits
> groupes (3-6 personnes) où chaque participant, encadré par les
> experts Datalift, met les mains dans le cambouis -- si possible
> avec ses propres données.
>
> 17h00 : restitution de 4 minutes par groupe : qu'a-t-on réalisé ?
> quelles opportunités et difficultés identifiées ?
>
> 17h30 : Fin de la session.
>
> *De quoi ai-je besoin pour venir ? *
>
> *
>
> s'inscrire impérativement – l'entrée est libre et gratuite :
> http://dataliftcamp.eventbrite.fr/
>
> *
>
> si possible venir avec son PC portable pour la pratique ; la
> connexion internet via wifi est prévue sur place
>
> *
>
> éventuellement, commencer à regarder vos jeux de données et
> réfléchir à ceux qui auraient le plus de sens pour vous
>
> *
>
> les repas ne sont pas pris en charge mais, si vous le
> souhaitez, un déjeuner de groupe est proposé (~15-20€)
>
> *Les partenaires de Datalift*
>
> Atos Origin, EURECOM, l'IGN, INRIA (équipes EXMO et WIMIX),
> l'INSEE, le LIRMM, Mondeca et la Fing.
>
> http://datalift.org/
>
>
>
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr at openstreetmap.org <mailto:Talk-fr at openstreetmap.org>
> http://lists.openstreetmap.org/listinfo/talk-fr
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.openstreetmap.org/pipermail/talk-fr/attachments/20120912/025849a9/attachment.htm>
Plus d'informations sur la liste de diffusion Talk-fr