FranceArchives : portail de référence pour les archives françaises dans le web de données liées
Présenté par :
Porté par le Service interministériel des Archives de France, FranceArchives
est le portail agrégateur national pour les archives françaises depuis 2017 et
offre une recherche fédérée dans près de 22 millions de métadonnées
archivistiques produites par près de 140 institutions. À ce titre, il est un
acteur évident sinon attendu pour les archives françaises dans le web de
données liées. Cependant, l'hétérogénéité des données et la description
hiérarchique des archives en font un véritable défi. Le portail a profité des
opportunités des technologies du web sémantique pour traiter les entités
personnes, institutions, lieux et thèmes, extraites des indexations figurant
dans les inventaires d'archives, en les :
- Désambiguisant grâce à des URI ;
- Alignant vers les référentiels du Linked Open Data, tels que GeoNames,
Wikidata, data.bnf et le thésaurus pour l'indexation matières des archives ;
- Enrichissant avec des dates, des descriptions et des coordonnées
géographiques.
Pour pleinement intégrer FranceArchives au Linked Open Data, les données sont
converties, à partir de la base de données CubicWeb, en RDF en utilisant
l'ontologie RiC-O version 0.2 publiée en février 2021. FranceArchives est le
premier projet à utiliser ce modèle à grande échelle avec un certain succès.
C'est également l'un des premiers entrepôts de données archivistiques de
cette taille sur le Linked Open Data. Pour assurer une expérience utilisateur
optimale, un graphe restreint aux données de qualité est exposé dans l'entrepôt
SPARQL et peut être exploré grâce à l'outil Sparnatural. Une ontologie,
rédigée spécifiquement pour cette instance de Sparnatural, permet le requêtage
des données le plus fin possible tout en s'adaptant à l'hétérogénéité des
données.
Enregistrement de la présentation :
https://peertube.semweb.pro/w/hbN4fowkaDkkRzqbCShREQ