Découvrabilité, données ouvertes et liées | mythes et réalités

La percée de l'idée qu'il soit possible de facilement mettre à contribution les technologies du Web sémantique pour accroître la découvrabilité des contenus culturels en ligne fait actuellement des ravages. Si ces approches sont souhaitables afin de mutualiser les efforts et économiser des deniers publics alloués sous forme de subventions, leur mise en place est beaucoup plus complexe que ne le laissent croire plusieurs mythes qui ont actuellement cours.

conception d’une base de données structurées, ouvertes et liées sur la transmission des savoirs technologiques dans les arts... la base de données se servira des identifiants uniques Wikidata pour mieux placer son contenu dans les algorithmes de recommandation, dans le Web.

Le passage qui précède a été repiqué sur un site culturel québécois. Il est symptomatique de la dérive à laquelle nous devons prendre garde. Nous devons recadrer ce que semblable effort implique.

Il faut tout d'abord rétablir une vérité un peu malmenée : activer la découvrabilité de propositions culturelles en utilisant les annotations sémantiques et les principes d'inter-opérabilité représente un effort extrêmement complexe. Ce n'est pas simple. Cela représente beaucoup de travail et demande des ressources. Les plus beaux projets qui vont déjà en ce sens ont encore des efforts considérables à engager : que l'on parle du projet Wikidata des arts de la scène de CAPACOA, de la vitrine en ligne des collections du Musée national des beaux arts du Québec ou encore des projets du Réseau canadien d'information sur le patrimoine, tous ont plus de trois ans d'efforts engagés et poursuivent leur développement avec acharnement. Il en va de même pour les projets industriels de mutualisation comme MétaMusique, Scène Pro ou La Culture Crée. Ces choses là ne se font pas par magie.

Cet article n'entrera pas dans l'explication détaillée du travail qui doit être engagé dans un chantier de données liées, mais nous lançons néanmoins une liste des grands jalons à considérer afin de sonner la fin de la pensée magique et engager la réflexion. Voici selon moi la liste des étapes à mettre en œuvre pour harnacher le potentiel des données ouvertes et liées en culture.

  1. Établir des consensus sectoriels sur les termes et métadonnées des métiers, la sémantique usuelle - définir des scénarios d'usage et des parcours utilisateur pour y parvenir;
  2. Traduire les termes métiers vers des ontologies normées exprimées en langage machine
  3. Associer les termes métiers à des concepts décrits en ligne de façon pérenne par des URI hiérarchiques ou opaques
  4. Associer les ressources consignées dans les bases de données à des identifiants uniques stables
  5. Arrimer ensemble divers thésaurus et ontologies composées de triplets sujet-propriété-objet
  6. Préparer et faire signer les cessions de droits pour les artefacts et médias à publier
  7. Déposer des données dans les communs numériques comme Wikidata et Wikimedia Commons
  8. Publier des données dans des bases en graphes offrant des points d'accès SPARQL
  9. Lier entre elles des bases de données, automatiser leur synchronisation
  10. Publier des données sur des portails, des interfaces consultables ou interrogeables par l'humain
  11. Ajouter des microdonnées lisibles par les machines dans les interfaces et les pages Web
  12. Assurer la gouvernance collective de données provenant de sources diverses et agrégées

Vos commentaires, critiques et questions auront pour tous un grand intérêt, j'en suis certain. 

Un article qui constitue un suivi à celui-ci a été publié le 19 avril 2021 : Jalons pour activer la découvrabilité des donnees ouvertes et liées en culture

Pour poursuivre cette réflexion nous recommandons la lecture des publications produites dans le cadre de la feuille de route stratégique « Métadonnées culturelles et transition web 3.0 » du Ministère de la culture et des communications (France) et ce, malgré leur publication il y a déjà 6 ans...

Aliacar, R., Bermès, E., Briatte, K., Cabrera, F. M., Davoigneau, J., Peyrard, S., … Vignaud, L. (2015, décembre). Identifiants pérennes pour les ressources numériques : Vade-mecum pour les producteurs de données. Paris : Ministère de la culture et des communications. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Identifiants-perennes-pour-les-ressources-numeriques

Grimaud, F., Alim, N., Briatte, K., Choppe, C. et Defrance, J.-P. (2015, décembre). Référentiel de formation Web sémantique, web des données. Ministère de la culture et des communications. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Web-semantique-Web-des-donnees-Sensibilisation-et-formation-des-acteurs-culturels

LIRIS, MAEDI et MCC. (2015, décembre). Traçabilité des données numériques - Quels modèles pour la provenance des données numériques? État de l’art. Paris : Ministère de la Culture et de la Communication. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Tracabilite-des-donnees-numeriques

Troncy, R., Antipolis, S. et Bailly, R. (2016, décembre). Application des technologies 3.0 à la description des événements culturels. Paris : Ministère de la Culture et de la Communication. Récupéré de https://www.culture.gouv.fr/Sites-thematiques/Innovation-numerique/Donnees-publiques/Application-des-technologies-3.0-a-la-description-des-evenements-culturel

Commentaires

Pour consulter les commentaires ou pour commenter cette publication, vous devez vous connecter sur Passerelles ou vous inscrire.