– Construire une bibliothèque numérique

 photo : ChCariouUne bibliothèque numérique peut être définie comme une collection organisée de documents digitaux, qu’ils aient été numérisés dans le cadre d’une opération patrimoniale ou qu’ils soient nativement numériques comme les ebooks. Ces documents sont accessibles par le biais d’une interface de recherche et de consultation.

Pour réaliser cette interface, il faut distinguer les solutions de Gestion de Bibliothèque Numérique des solutions de Digital Asset Management (DAM) ou de Gestion Electronique de Document (GED) qui regroupent un ensemble de fonctionnalités permettant aux organisations de stocker et partager leurs ressources numériques (GED et DAM, quelle différence ?).

Nous nous intéresserons dans ce mémo aux étapes de création d’une bibliothèque composée de documents patrimoniaux numérisés dans un cadre universitaire. La démarche peut également être appliquée à la création d’une bibliothèque d’ebooks ; cependant les fournisseurs de contenus numériques proposent souvent une interface de recherche et de consultation déjà élaborée, comme nous l’avons vu dans les articles suivants sur les ebooks juridiques et les manuels numériques.

A.    L’analyse préliminaire

1. Pourquoi créer une bibliothèque numérique ?

Le point de départ de la démarche vise à argumenter, notamment vis-à-vis des tutelles de l’institution, sur les raisons de mise en place d’une bibliothèque numérique. Il s’agit donc de :

  • rendre les documents numérisés par l’institution visibilité sur le web;
  • répondre aux besoins d’utilisateurs identifiés ou potentiels;
  • participer à la promotion des biens communs et à la diffusion des connaissances par la gratuité d’utilisation.

2. Quels contenus pour quels publics ?

Mettre en place une bibliothèque numérique implique de bien réfléchir au périmètre du corpus de documents à proposer. Il faudra :

  • délimiter l’ensemble documentaire :
    • quels types de document (ouvrage, périodique, estampe, photographie, etc) la bibliothèque contiendra-t-elle  ?
    • quelle sera la provenance des métadonnées associées (nativement créées pour la numérisation, issues du catalogue des collections ou d’une base d’archives comme Calames) ?
    • incidemment, quels types de métadonnées préexistantes (UNIMARC, INTERMARC, Dublin Core, EAD) faudra-t-il convertir et intégrer  ?
  • identifier les usages souhaités :
    • public spécifique (chercheurs, étudiants) ou grand public ?
    • gratuité de la consultation et/ou de l’ensemble des services ?
    • accessibilité aux personnes déficientes visuelles (avec fichiers DAISY) ?
    • ergonomie de recherche avancée (recherche au titre, dans le document par l’océrisation) ?
    • conditions de réutilisation (cf; licences Creative Commons) des documents larges ou restrictives ?
  • déterminer les conditions de conservation des fichiers :
    • format de fichiers différents pour la consultation et la conservation ?
    • mise en place sur un serveur propriétaire ou externalisation ?

B. L’analyse fonctionnelle

1. Quelles fonctionnalités pour le front-office ?

L’interface publique choisie devrait permettre de mettre en place certains services parmi un éventail de possibilités :

  • faire des recherches simples ou complexes dans le plein texte ou l’indexation du document ;
  • naviguer dans les collections par le biais d’index, de table des matières, de thésaurus ;
  • changer la langue du site ;
  • consulter le site sur une tablette, un smartphone ou un ordinateur ;
  • exporter des références dans un logiciel de référence bibliographiques ;
  • rebondir sur des références dans d’autres bibliothèques numériques ou catalogues (Sudoc, Gallica… ) ;
  • partager la page d’un document sur les réseaux sociaux ;
  • télécharger les pages d’un document dans différents formats et résolutions ;
  • imprimer le document en entier ou seulement des pages sélectionnées ;
  • disposer d’un compte personnel pour enregistrer ses recherches, mémoriser des documents dans des listes de lecture, créer des alertes par mail, enregistrer, annoter ou commenter les documents;
  • comparer un document avec un autre document issu d’une autre bibliothèque numérique.

2. Quels fonctionnalités pour le back-office ?

Pour les administrateurs de la bibliothèque numérique et les contributeurs internes, le choix d’un outil ergonomie et pratique est essentiel. Le logiciel ou la plateforme choisie doit permettre de :

  • personnaliser facilement l’interface suivant la charte graphique de l’établissement;
  • présenter des documents numérisés selon une logique de collections et de corpus avec des services à valeur ajoutée;
  • gérer les tables des matières pour naviguer dans le document;
  • créer des parcours d’exposition virtuelle;
  • offrir une maquette « responsive web design » pour la consultation multisupport;
  • indexer les contenus suivant la granularité voulue;
  • rendre les documents interopérables selon le protocole IFFF;
  • importer/exporter les métadonnées des documents numérisés dans de nombreux formats;
  • créer des profils de contributeurs pour alimenter la bibliothèque ou éditorialiser des contenus.

C. Le choix de l’outil informatique

1. Les solutions possibles :

Il faut tout d’abord déterminer les moyens techniques, humains et financiers qui seront affectés à la mise en place de l’outil informatique car cela conditionne les choix possibles :

  • Si vos moyens sont limités, la solution la plus simple sera probablement de recourir à un système de gestion de contenu (CMS), comme WordPress, Joomla, Typo3 ou Drupal.
  • Une solution préférable consiste à utiliser un logiciel libre de gestion de bibliothèques numériques :
    • Omeka, utilisé notamment par Europeana et la nouvelle version dite ‘Omeka S’ qui intégre une couche sémantique de lien entre les données pour rendre les documents interopérables.
    • Greenstone  porté par la Bibliothèque Nationale de Nouvelle Zélande (http://nzetc.victoria.ac.nz/)
  • La BnF propose avec « Gallica Marque Blanche » de réaliser une bibliothèque numérique construite sur la base de l’infrastructure Gallica, mais paramétrée et personnalisée aux couleurs de la bibliothèque partenaire. Une volonté de coopération et de mutualisation qui a donné naissance à de remarquables bibliothèque numériques (notamment la bibliothèque du Réseau Francophone Numérique et Numistral).
  • Il est possible de détourner des logiciels libres de gestion de contenu comme Nuxeo, Alfresco ou DSpace (plutôt orienté vers la gestion d’archives ouvertes et utilisé par la Digital Access to Scholarship at Harvard) mais il faudra intégrer au projet une importante phase de développement informatique.

–> Wikipedia présente une liste exhaustive de solutions logicielles pour bibliothèques numériques.

2. Le parangonnage

Il faut ensuite réaliser un benchmarking de bibliothèques numériques existantes en analysant à la fois les fonctionnalités mises en œuvre mais aussi les contraintes imposées par le choix de l’outil informatique. On étudiera par exemple les site suivants :

Pour chaque interface étudiée, il faut noter les fonctionnalités intéressantes en fonction des critères déterminés dans l’analyse fonctionnelle : par exemple pour l’accessibilité dans Gallica, on étudiera la page https://gallica.bnf.fr/html/und/accessibilite qui expose la conformité du site au RGAA permettant de :

  • Naviguer avec des synthèses vocales et/ou des plages braille (notamment utilisées par les internautes aveugles ou malvoyants).
  • Personnaliser l’affichage du site selon ses besoins (grossissement des caractères, modification des couleurs, etc.).
  • Naviguer sans utiliser la souris, avec le clavier uniquement ou via un écran tactile.

D. Le cahier des charges

L’analyse des besoins, l’analyse fonctionnelle et le benchmarking ont un but  : aider à construire l’Avant Projet Détaillé (APD) et le Cahier des charges (CDC) de la future bibliothèque numérique. Pour cela, on peut reprendre les étapes mentionnées sur ce site dans ma fiche mémo « Conduire un projet documentaire« .

Il est cependant fortement recommandé de rédiger un cahier des charges pour la réalisation de l’interface informatique, même si celle-ci prend la forme d’un CMS grand public (WordPress, Drupal) adapté pour la circonstance aux besoins d’une bibliothèque numérique. Cela permet de formaliser les résultats attendus en terme d’ergonomie. Si l’interface informatique est réalisée en interne, on supprimera simplement les paragraphes juridiques consacrés à la passation du marché.

Ci dessous un exemple de plan type de cahier des charges pour l’élaboration d’une plateforme de consultation d’une bibliothèque numérique (avec un point développé pour montrer le degré de finesse que doit atteindre le CDC).

1. Contexte du projet

  • Objectifs
  • Méthode
  • Choix d’un logiciel

2. Description de l’Interface de consultation

  • Accessibilité (langues, navigateurs certifiés et usages en mobilité)
  • Personnalisation de l’interface
  • Description de la page d’accueil
  • Description de l’interface de recherche
    • Les modes de recherches
    • Les interfaces de recherche
    • L’affichage des résultats de recherche :
      • les facettes de filtrage suivantes doivent être présentes au premier niveau d’affichage de tous les résultats de recherche quel que soit le mode de recherche (simple, avancée) utilisé : Corpus/Collections /Titre /Auteur /Sujet /Editeur /Type /Date /Langue;
      • chaque facette affiche 5 résultats (les autres résultats pouvant être consultés en cliquant sur +);
      • possibilité de filtrer et de supprimer les filtres sur les facettes;
      • dans la liste des résultats, il faut afficher le titre en entier et en premier,  puis l’auteur, la date, les mentions d’édition;
      • la page de résultats doit pouvoir être imprimée comme une liste de documents.
  • Description de l’affichage individuelle d’une notice
  • Modes de consultation du document numérisé (présence d’un permalien, mode d’affichage du document en simple page ou en double page, etc.)

3. Services associés à la consultation d’un ou plusieurs documents

  • Export des références et des métadonnées
  • Déchargement d’un document
  • Gestion de panier et Diffusion Sélective de l’Information (DSI)
  • Indexation et correction collaboratives
  • Suggestion de numérisation
  • Reproduction des documents
  • Impression de facsimilés à la demande
  • Réutilisation des documents sur le web et les réseaux sociaux
    • Insertion sur un site par code HTML
    • Signalement sur les réseaux sociaux

4. Données techniques

  • Interface de diffusion Machine To Machine
    • Diffusion par OAI-PMH
    • Interface de recherche distante SRU (Search Retrieve via URL)
    • OpenURL et WebServices
    • Compatibilité IIIF
  • Référencement
  • Statistiques
  • Prestations de conversions et d’imports de métadonnées
  • Support (documentation fournie, wiki, formation en présentiel et à distance)
  • Performances du site attendues
  • Environnement technique (serveurs)
  • Maintenance