Les standards du Web sémantique: RDF, OWL, SPARQL...

standards du Web sémantiqueLes standards du Web sémantique

  • Le XML fournit une syntaxe élémentaire, pour la structure du contenu dans les documents, mais il ne décrit pas la sémantique du document.
  • XSD est un langage de description de format de document XML permettant de définir la structure et le type de contenu d'un document XML. Cette définition permet notamment de vérifier la validité de ce document.
  • Le RDF est un langage simple pour exprimer des modèles de données sous forme d'objets (« ressources ») et de leurs relations. Un modèle basé sur RDF peut être représenté à travers plusieurs syntaxes d'échanges, par exemple, RDF/XML, N3, Turtle, et RDFa. Voir http://www.w3.org/TR/2014/REC-rdf11-mt-20140225/ ou mieux http://www.w3.org/TR/rdfa-lite/
  • RDF Schema (ou RDFS) étend le RDF et son vocabulaire pour pouvoir structurer les propriétés et les classes au sein d'une ressource décrite en RDF.
  • OWL ajoute plus de vocabulaire pour décrire les propriétés et les classes : comme avec les relations entre les classes, la cardinalité (par exemple « exactement un »), l'égalité, le typage des propriétés, les caractéristiques de propriétés (par exemple la symétrie), etc.
  • SPARQL (prononcé sparkle) est un langage de requête et un protocole qui permettra de rechercher, d'ajouter, de modifier ou de supprimer des données RDF disponibles dans le Web à travers l'Internet.

Définitions de base

RDF Resource Description Framework

est un modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs métadonnées. Développé par le W3C, RDF est le langage de base du Web sémantique. L'une des syntaxes (ou sérialisations) de ce langage est RDF/XML. D'autres sérialisations de RDF sont apparues ensuite.

Un document structuré en RDF est un ensemble de triplets. Un triplet RDF est une association : (sujet, prédicat, objet)
    Le sujet représente la ressource à décrire ;
    Le prédicat représente un type de propriété applicable à cette ressource ;
    L'objet représente une donnée ou une autre ressource : c'est la valeur de la propriété.

Le sujet, et l'objet dans le cas où c'est une ressource, peuvent être identifiés par une URI ou être des nœuds anonymes. Le prédicat est nécessairement identifié par une URI.

Les documents RDF peuvent être écrits en différentes syntaxes, y compris en XML. RDF est une structure de données constituée de nœuds et organisée en graphe. Bien que RDF/XML — sa version XML proposée par le W3C — ne soit qu'une syntaxe (ou sérialisation) du modèle, elle est souvent appelée RDF. Un abus de langage désigne à la fois le graphe de triplets et la présentation XML qui lui est associée.

 Cette sémantique peut être aussi traduite en formule de logique du premier ordre, positive, conjonctive et existentielle :     {sujet, objet, prédicat} ⇔ prédicat(objet, sujet)
ce qui est équivalent à :     ∃ objet, ∃ sujet tq prédicat(objet, sujet)

Vocabulaires RDF

La structure de RDF est extrêmement générique et sert de base à un certain nombre de schémas ou vocabulaires dédiés à des applications spécifiques. Une partie de ces vocabulaires est spécifiée par le W3C (comme les langages d'ontologie RDFS et OWL, ou le vocabulaire SKOS pour la représentation des thésaurus et autres vocabulaires structurés). D'autres vocabulaires RDF, sans être spécifiés par le W3C, sont néanmoins utilisés largement et constituent des standards de fait dans la communauté du Web Sémantique, comme par exemple FOAF qui est destiné à la représentation des personnes.

Langages de requête

Il y en a plusieurs.  SPARQL, développé par le W3C, est destiné à devenir le standard.

RDFa

pour « Resource Description Framework dans des Attributs » est une recommandation du W3C définissant une syntaxe permettant d'ajouter des données structurées dans une page HTML ou n'importe quel document XML.
RDFa a atteint le statut de recommandation 1.0 le 14 octobre 2008 et 1.1 le 22 août 2013. http://www.w3.org/TR/rdfa-lite/ date de mars 2015.

RDFa est un ensemble d'éléments et d'attributs. RDFa utilise pour partie la syntaxe HTML existante :
    l'attribut class - permettant de spécifier le type de l'objet
    l'attribut id - indirectement, servant à définir l'URI d'un objet dans la page
    les attributs rel, rev et href - spécifiant une relation avec une autre ressource

RDFa ajoute ses propres éléments, les attributs :
    about - une URI spécifiant la ressource décrite par les métadonnées ; si vide = document en cours;
    property - spécifiant une propriété pour le contenu d'un élément;
    content - attribut optionnel qui remplace le contenu d'un élément quand on utilise l'attribut de propriété.
    datatype - attribut optionnel qui spécifie le type de donnée du contenu;
    resource - attribut optionnel spécifiant une ressource externe, en général non cliquable. Il remplace @href et @src dans les éléments qui ne sont pas identifiés comme liens. Il représente aussi la destination de la propriété (et non la source comme c'est le cas pour @about).

RDFa est une technique proche des microformats (permet d'ajouter de la sémantique au contenu d'une page). Elles diffèrent sur 2 points:

   * RDFa est extensible très facilement du fait qu'il utilise des espaces de nom ;
   * RDFa 1.0 n'était normalement utilisable qu'avec XHTML 1.1 et > ; les microformats, en revanche, s'adaptent aux deux normes les plus répandues sur le Web, HTML 4.01 et XHTML 1.0.
RDFa 1.1 permet l'utilisation de RDFa avec HTML51 ou n'importe quel document XML.

 

REC w3c: GRDDL · OWL · RDF · RDFa · RDFS · RIF · SKOS · SPARQL 1.1 · SVG · XML · XML Schema

http://www.w3.org/TR/rdfa-lite/ date de mars 2015.

http://www.w3.org/TR/2014/REC-rdf11-mt-20140225/