Wikidata – le prochain grand projet de Wikipedia

Une des présentations les plus attendues de la conférence Semantic Tech & Business, à Berlin, était l’intervention tardivement programmée de Denny Vrandecic.

Compte tenu de la prédominance de Dbpedia dans le monde du « linked data cloud » (jeux de données liées ouvertes publiées dans le Cloud), toute nouveauté provenant de Wikipedia incluant l’utilisation de données structurées attire à coup sûr l’attention, et nous n’avons pas été déçus.

Vrandecic a commencé en annonçant qu’à partir de mars, il serait à Berlin pour travailler avec la fondation Wikipedia sur le projet WikiData.

Il a alors poursuivi en expliquant que si les riches ressources de Wikipedia pouvaient contenir une très large part des connaissances du monde, elles n’avaient pour autant pas toutes les réponses. Il y a par exemple de grandes disparités de couverture entre les différentes versions linguistiques.

De même, Wikipedia ne peut répondre à une question du type « Quelles sont les 10 plus grandes villes dont le maire est une femme« . Vous obtiendrez des villes en réponse mais la plupart sinon la totalité d’entre elles n’auront pas de femme pour maire.

Un moyen qui a s’est largement répandu pour répondre à ce type de requête, ce sont les listes. Le problème avec les listes c’est qu’il y en a des tonnes, en plusieurs langues, souvent avec des doublons, et enfin des tableaux de listes de listes.

Nous devons accepter le fait que Wikipedia n’a pas toutes les réponses – les humains peuvent lire des articles mais les ordinateurs ne peuvent pas en comprendre le sens.

Les articles créés par WikiData sur un certain sujet renverront, eux, aux articles wikipedia pertinents dans toutes les langues.

Dbpedia a très bien réussi à extraire l’information des info-box de Wikipedia pour les publier sous forme de données, mais celles-ci ne sont pas éditables. WikiData renversera ce modèle en proposant un environnement d’édition des données qui seront alors automatiquement réinjectées dans les info-box de Wikipedia.

WikiData référencera également des bases de données secondaires. Par exemple en indiquant que le World Factbook de la CIA est intéressant pour tel ou tel sujet.
WikiData ne définira pas la vérité révélée, il permettra seulement de collecter les références aux données.

Denny Vrandecic a défini les objectifs de WikiData comme étant:

  • Fournir une base de données des connaissances du monde, que n’importe qui puisse éditer et modifier
  • Collecter des références et citations pour des millions de données
  • Fédérer une communauté sur le long terme qui recueille des données provenant de partout d’une manière interprétable par un ordinateur
  • Accroître la qualité et réduire les coûts de maintenance de Wikipedia et des projets annexes
  • Fournir du code et des bonnes pratiques pour la communauté lui permettant de à des projets de collecte et fourniture de données

La phase 1 de WikiData comprend la création d’une page WikiData pour chaque entité de Wikipedia, et liste ensuite ses représentations dans chaque langue.

Ces versions individuelles – par langues – intégreront par la suite des liens en provenance de Wikidata. Cette étape devrait être achevée cet été.

La seconde phase consistera a centraliser les valeurs des données contenues dans les infobox de Wikipedia et de faire en sorte que les infoboxes des différentes versions liguistiques de Wikipedia aillent chercher leurs données à partir de Wikidata.

La phase finale permettra de faire des requêtes directes depuis Wikipedia vers WikiData, et de présenter les résultats dans différents formats.

Vrandecic n’a pas fourni de calendrier pour la seconde et la troisième phase, qui s’ajoutent à l’objectif consistant à fournir librement, de manière ré-utilisable, compréhensible par les machines, un accès aux données mondiales.

Nous voici au début d’un projet passionant de WikiMedia, qui pourrait radicalement influencer le paysage des données.

 

______________

Traduction collaborative réalisée par des internautes du monde entier.

Source : Dataliberate

Auteur : Richard Wallis

Tags: , , , ,

3 Réponses à “Wikidata – le prochain grand projet de Wikipedia”

  1. 30 mars 2012 à 09:38 #

    Where does this nice picture come from?

Trackbacks/Pingbacks

  1. Pratiques Innovantes | Pearltrees - 4 avril 2012

    […] Fournir du code et des bonnes pratiques pour la communauté lui permettant de à des projets de collecte et fourniture de données Wikidata – le prochain grand projet de Wikipedia | Fhimt.com […]

  2. Actus Généralistes 2012 S14 | La Mare du Gof - 9 avril 2012

    […] => Wikidata – le prochain grand projet de Wikipedia. 23/03/2012. «Une des présentations les plus attendues de la conférence Semantic Tech & Business, à Berlin, était l’intervention tardivement programmée de Denny Vrandecic. Compte tenu de la prédominance de Dbpedia dans le monde du « linked data cloud » (jeux de données liées ouvertes publiées dans le Cloud), toute nouveauté provenant de Wikipedia incluant l’utilisation de données structurées attire à coup sûr l’attention, et nous n’avons pas été déçus (…).» Source : http://www.fhimt.com/2012/03/23/wikidata-le-prochain-grand-projet-de-wikipedia/ […]

Laisser un commentaire

Vous devez être connecté pour poster un commentaire.