Introduction au web sémantique

49
Introduction au web sémantique Stéphane Traumat - Scub / Quatuo

description

Ces slides présentent les grands principes du web sémantique.

Transcript of Introduction au web sémantique

Page 1: Introduction au web sémantique

Introduction au web sémantique

Stéphane Traumat - Scub / Quatuo

Page 2: Introduction au web sémantique

Plan de la présentation• Pourquoi le web sémantique ?• La modélisation des données.• Comment exprimer du sens ?• Utilisation des données sémantiques.• RDF.• Les ontologies.• FOAF (aka Friend Of A Friend).• Le "global graph".

Page 3: Introduction au web sémantique

Pourquoi le web sémantique ?

Page 4: Introduction au web sémantique

Comment le web fonctionne ?Le web fonctionne parce que, nous, les humains sommes extrêmement doués et flexibles dans le traitement de données.

Nous sommes capables de tout lire et d'acquérir de nouvelles connaissances.

Aujourd'hui, Google trouve l'information mais ne la comprend pas !

Page 5: Introduction au web sémantique

Réponse de Google à une question

Page 6: Introduction au web sémantique

Le web aujourd'hui... c'est quoi ?• Les machines stockent le texte.• On peut rechercher dans l'ensemble des

textes grâce à des outils comme Google. • On clique sur une page pour l'afficher.• L'humain doit lire le texte, chercher

l'information qui l'intéresse et la comprendre.

Page 7: Introduction au web sémantique

C'est assez basique...• N'est-ce pas dommage que les machines ne

soient pas capable de tirer partie des informations que nous mettons sur Internet ?

• N'est ce pas dommage que des millions de pages indiquent le lieu de naissance d'Einstein et que Google nous répondre qu'il faut que nous lisions les pages qu'il indique ?

Page 8: Introduction au web sémantique

Et donc voici le web sémantiqueL'idée du web sémantique est de fournir aux machines des données qu'elles pourraient comprendre et à partir desquelles elles pourraient tirer de nouvelles connaissances.

Les applications pourraient extraire des informations de différentes sources et les combiner.

Page 9: Introduction au web sémantique

Résultat avec données structurées (*)

Page 10: Introduction au web sémantique

Qu'est ce que cela change ?• Nous passerions d'un monde où nous

publions des données pour les humains à un monde où nous publions aussi des données lisibles et compréhensibles par les machines.

• L'objectif étant de permettre aux machines de faire un peu plus de travail à notre place :)

Page 11: Introduction au web sémantique

Exemple : Liste des albums de U2

Page 12: Introduction au web sémantique

Exemple : Villes avec 'Red' ou 'Blue'

Page 13: Introduction au web sémantique

Autres exemples...• Je veux tous les acteurs qui ont joué dans un

film dans les années 70 avec un acteur qui s'appelle "Robert" qui a entre 30 et 40 ans.

• Je veux toutes les chansons qui ont "love" dans leur titre et qui ont été écrites par des gens qui n'ont jamais été marié.

• Je veux la liste des entreprises parisiennes crées entre 1970 et 1980 et qui ont été dirigée par au moins une personne ayant fait ses études à HEC

Page 14: Introduction au web sémantique

Libérer les donnéesLe web sémantique a pour but de fournir un moyen standardisé d'utiliser et de publier des données sans avoir à fournir un travail considérable pour obtenir et intégrer ces données.

De cette façon, des programmes intelligents pourront lire ces données et en tirer des informations pertinentes.

Page 15: Introduction au web sémantique

L'idée généraleDes données publiées partout pour être lues par des machines.

Des programmes qui parcourent Internet à la recherche des ces données afin d'augmenter leur connaissance.

Des outils qui nous font des réponses exactes à nos questions.

Page 16: Introduction au web sémantique

La modélisation des données

Page 17: Introduction au web sémantique

TabulaireC'est la manière la plus simple (CSV, Excel...) pour afficher, trier, imprimer et modifier des données.

Le problème, comment gérer, par exemple, des tarifs, des journées de fermeture ou des horaires d'ouverture ?

Page 18: Introduction au web sémantique

Données relationnellesLe modèle relationnel permet de stocker des données dans de multiples tables et de faire des liens entre elles.

On peut ainsi mieux représenter les choses et faire des requêtes plus complexes.

Le problème : il faut analyser et figer l'organisation des données.

Page 19: Introduction au web sémantique

Relations SémantiquesL'idée est de déplacer toutes les relations tables / champs / clé au format clé / propriété / valeur. 1 Nom Traumat 1 Prénom Stéphane 2 Nom Eastwood 2 Prénom Clint

C'est un schéma flexible qui se décrit lui même.

Page 20: Introduction au web sémantique

Comment exprimer du sens ?

Page 21: Introduction au web sémantique

Comment exprimer du sens ?Les informations sont représentées sous forme de Triplets, c'est à dire une association entre sujet, prédicat et objet.

• Le sujet représente la ressource à décrire. • Le prédicat représente un type de propriété

applicable à cette ressource. • L'objet représente une donnée ou une autre

ressource : c'est la valeur de la propriété.

Page 22: Introduction au web sémantique

ExempleSujet -> Prédicat -> Objet

• Bill Gates dirige Microsoft • Bill Gates est né en 1950 • Microsoft est basé à Seattle • Seattle est dans l'état de Washington

Page 23: Introduction au web sémantique

Exemple en XML<rdf:Description rdf:about="http://www.quatuo.com/stephane.traumat/foaf.rdf"> · <foaf:givenname>Stéphane</foaf:givenname> <foaf:nick>trom</foaf:nick> <foaf:phone>+33 5 45 373 373</foaf:phone> · <foaf:workplace>http://www.scub.net</foaf:workplace> </rdf:Description>

Page 24: Introduction au web sémantique

Utiliser les données sémantiques

Page 25: Introduction au web sémantique

InférenceL'inférence est une opération qui consiste à tirer une conclusion à partir de règles de base.

Imaginons une base sur les goûts des gens : • Stéphane Traumat aime Haricots Imaginons une autre base sur les aliments :• Haricot est un légume Une application peut en déduire : Stéphane aime certains légumes

Page 26: Introduction au web sémantique

Inférence - Autres exemplesAutres exemples : • Si une personne vit en France et qu'elle a

moins de 18 ans, elle n'a pas le droit de voter. • Si une entreprise est à Angouleme, je peux

considérer qu'elle est en Charente. • Si une personne fait un poids de 100 kg et

qu'elle fait moins de 1m70, je peux dire qu'elle est en surpoid.

Page 27: Introduction au web sémantique

Fusion des graphesUne des plus importantes propriétés des graphes d'objets est que l'on peut fusionner deux graphes facilement si ces deux graphes ont deux identifiants en commun. Et le tout, sans effort.

Dans l'exemple des haricots, on a fusionné deux bases différentes.

Page 28: Introduction au web sémantique

Recherche de liensOn peut très facilement parcourir un graphe pour trouver, par exemple, ce qui relie deux entreprises ou deux personnes.

Les applications peuvent parcourir les graphes afin de trouver les données liées.

Page 29: Introduction au web sémantique

Faire des requêtesSPARQL est un langage pour faire des requêtes. Il est adapté à la structure spécifique des graphes RDF et s'appuie sur les triplets qui les constituent.

En cela, il est différent du classique SQL mais s'en inspire clairement dans sa syntaxe et ses fonctionnalités.

Page 30: Introduction au web sémantique

Faire des requêtes - exemplePREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?name ?birth ?death ?person WHERE { ?person dbpedia2:birthPlace <http://dbpedia.org/resource/Berlin> . ?person dbo:birthDate ?birth . ?person foaf:name ?name . ?person dbo:deathDate ?death FILTER (?birth < "1900-01-01"^^xsd:date) .}

Page 31: Introduction au web sémantique

Résultat de la requête

Page 32: Introduction au web sémantique

RDF

Page 33: Introduction au web sémantique

RDFResource Description Framework (RDF) est un modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions.

Développé par le W3C, RDF est le langage de base du Web sémantique. Une des syntaxes de ce langage est RDF/XML.

Page 34: Introduction au web sémantique

Les ontologies

Page 35: Introduction au web sémantique

Les ontologiesL'ontologie est l'ensemble structuré des termes et concepts représentant le sens d'un champ d'informations, que ce soit par les métadonnées d'un espace de noms, ou les éléments d'un domaine de connaissances.

Une ontologie fournit un vocabulaire précis pour expliquer quelque chose.

Page 36: Introduction au web sémantique

FOAF (aka Friend Of A Friend)

Page 37: Introduction au web sémantique

FOAFFOAF est une ontologie pour décrire une personne et ces relations avec d'autres.

Page 38: Introduction au web sémantique

FOAF sample

Page 39: Introduction au web sémantique

QuatuoQuatuo est une application Google App Engine qui fait plusieurs choses : • Il permet à n'importe qui de créer un profile

FOAF et de l'exposer sur le web.• Il parcours le web à la recherche de profils

FOAF et les enregistrent dans la base.• Permet de faire des recherches sur les profils

FOAF et trouver les liens entre eux.

Page 40: Introduction au web sémantique

http://www.quatuo.com

Page 41: Introduction au web sémantique

Le graph global

Page 42: Introduction au web sémantique

La vision du graph globalLe web sémantique est en fait un gigantesque graph global qui est composé d'un ensemble de petits graph distributés sur Internet.

C'est aussi ce qu'on appelle les Linked Data.

Aujourd'hui, on estime qu'il y a 4,7 milliards de triples RDF reliés par 142 millions de liens RDF.

Page 43: Introduction au web sémantique

Une vision du global graph

Page 44: Introduction au web sémantique

La vision de Tim Berners-Lee (94)

Page 45: Introduction au web sémantique

Pour un ordinateur le web, c'est ça :

Page 46: Introduction au web sémantique

Et ça sera ça :

Page 47: Introduction au web sémantique

Questions ?

Page 48: Introduction au web sémantique

Et Google ? Ils commencent !

Page 49: Introduction au web sémantique

Plus d'informations...• [email protected]• http://www.scub.net• http://www.quatuo.com• http://twitter.com/straumat