Scorebot : utilisation du langage naturel pour interroger un graphe de partitions musicales
Présenté par :
La Médiathèque de la Philharmonie de Paris s’apprête à mettre en ligne un
chatbot - appelé “ScoreBot” - destiné à faciliter les recherches dans son fonds
de partitions musicales grâce aux technologies du web de données et au deep
learning.
L’outil permettra d’effectuer des requêtes dans le catalogue en utilisant des
formulations en langage naturel du type : “Je cherche des partitions pour
violon, flûte et piano du XIXe siècle” ou “Avez-vous des méthodes pour harpiste
débutant ?”. ScoreBot améliorera l’expérience utilisateur tout en permettant
d’exploiter la finesse des informations présentes dans la base de données. En
effet, peu d’utilisateurs parviennent aujourd’hui à formuler ces requêtes avec
le formulaire de recherche avancée ou le moteur à facettes disponibles.
Cette présentation décrit les différentes étapes du projet, de la conversion
des notices en RDF au paramétrage de l'interface de recherche. La génération de
requêtes SPARQL à partir de questions exprimées en langage naturel n’a été
rendue possible que récemment par les technologies de deep learning. Pour ce
projet, un modèle de type Transformer a été entraîné à extraire les
informations importantes des questions des utilisateurs, pour les insérer dans
des requêtes SPARQL pré-rédigées.
ScoreBot est une application pratique du projet de recherche DOREMUS présenté
lors d’une précédente conférence SemWeb.Pro. Une fois le projet finalisé, les
résultats seront rendus disponibles en opensource.
Interface de test consultable à cette adresse :
https://catalogue.philharmoniedeparis.fr/pprd-les-partitions.aspx
Enregistrement de la présentation :
https://peertube.semweb.pro/w/oU8gGq5pC2BQn8HiHhFasH