Gestion des nomenclatures en RDF avec XKOS
Présenté par :
L'Insee a recours aux vocabulaires RDF pour gérer une grande partie de ses
métadonnées relatives aux processus statistiques. Parmi celles-ci, les
nomenclatures sont centrales. Elles permettent de définir les concepts et les
codes et que l'on retrouve tout au long des processus statistiques : en début
de processus, par exemple pour stratifier une base de sondage, ou en diffusion,
en tant que grilles d'analyse de tableaux agrégés. Il est requis que les
nomenclatures nationales soient cohérentes avec les nomenclatures européennes
et internationales pour permettre de passer à l'échelle dans les comparaisons.
Les nomenclatures, en particulier lorsqu'elles sont partagées dans un format
RDF, permettent également de faciliter l'interopérabilité entre les processus
en fournissant une référence pour les codes et leur contenu.
Le standard XKOS, qui est un des produits RDF de la DDI Alliance, se base
essentiellement sur le standard SKOS et en propose des extensions pour répondre
aux spécificités des nomenclatures statistiques. Il permet de décrire leurs
structures hiérarchiques de manière formelle. Il introduit des sous-propriétés
qui spécialisent les relations skos:broader et skos:narrower. XKOS complète
aussi les notes skos:note et skos:scopeNote par une série de notes typiques des
nomenclatures : par exemple xkos:coreContentNote, xkos:inclusionNote ou encore
xkos:caseLaw. Enfin, XKOS propose une formalisation les tables de
correspondances qui sont nécessaires pour les travaux mettant en oeuvre
plusieurs nomenclatures.
Un guide de bonnes pratiques XKOS (un document ReSpec en cours de revue) donne
des exemples d'utilisation de ce vocabulaire. Les utilisations attendues des
propriétés RDF sont notamment spécifiées via des contraintes SHACL.
Les exemples d'implémentation de nos nomenclatures en XKOS sont accessibles via
le SPARQL EndPoint de l'Insee. Ces métadonnées sont gérées en interne avec
notre application de gestion des métadonnées, appelée Bauhaus, qui est publiée
en open source (cf. le lien ci-dessous).
liens :
* Les bonnes pratiques XKOS :
http://linked-statistics.github.io/xkos/xkos-best-practices.html
* La spécification XKOS :
https://ddialliance.org/Specification/XKOS/1.2/OWL/xkos.html#sem-props
* GitHub XKOS :
https://github.com/linked-statistics/xkos/blob/master/xkos-best-practices.html
* Insee SPARQL Endpoint https://rdf.insee.fr/
* Github Bauhaus https://github.com/InseeFr/Bauhaus
Enregistrement de la présentation :
https://peertube.semweb.pro/w/fXUH48yE984w1RRyN5TfXX