Diversité des usages des bibliothèques numériques. Méthodes d’étude à partir de l’exemple de Gallica.

Par Emmanuel BRANDL le 30 juin 2017

À travers le déploiement des supports et des offres de contenus, les usages numériques se sont progressivement diversifiés et il est plus difficile aujourd’hui de les saisir dans toute leur complexité.
Si tout un chacun peut aisément faire l’expérience d’un usage multitâche des écrans (peuvent se succéder lecture/rédaction de mails, recherche sur le web, lecture d’un article, rédaction d’un texte, etc.), d’un point de vue méthodologique, il est plus difficile d’établir les protocoles nécessaires à la saisie précise et rigoureuse de ces usages diversifiés pour restituer les logiques qui guident les utilisateurs eux-mêmes lorsqu’ils entrent un ou des mot(s)-clé(s), cliquent sur une icône, font défiler leurs listes de résultats, s’arrêtent sur un lien, reviennent en arrière, etc.
C’est pourquoi la journée d’étude « Quels usages aujourd’hui des bibliothèques numériques ? Enseignements et perspectives à partir de Gallica », organisée par la Bibliothèque nationale de France, le labex Obvil et Télécom ParisTech le 3 mai 2017, a souhaité revenir sur quelques pistes méthodologiques expérimentées.
La complémentarité méthodologique qui s’impose maintenant est frappante : l’approche qualitative (l’entretien semi-directif, l’observation ethnographique) est communément couplée à une approche quantitative (le questionnaire, aujourd’hui souvent diffusé en ligne). L’analyse des usages de Gallica ne fait pas exception, puisque la dernière étude a mobilisé l’entretien semi-directif, le questionnaire en ligne, mais aussi l’analyse de logs, et une analyse par vidéo-ethnographie des comportements devant écran.

Nous souhaitons présenter dans ce billet deux méthodes en particulier :
- l’analyse de logs,
- la vidéo-ethnographie, couplée à des entretiens dits « d’auto-confrontation ».

 

L’analyse de logs : méthode et apports

Si l’approche qualitative est riche d’enseignements détaillés, et permet une compréhension des habitudes de chacun, elle est souvent limitée par le fait de ne toucher que des utilisateurs avertis. Le panel en est donc réduit. Par ailleurs, l’approche quantitative habituelle permet d’obtenir des données statistiques simples de fréquentation, mais ne permet pas de produire une modélisation des usages. L’analyse de logs, ou « log learning », est une piste pour dépasser ces limites.

Un log ou plutôt une ligne de log est un fichier texte qui enferme des informations sur l’adresse IP (Internet Protocol1), la provenance, le pays, la ville, la date, la requête elle-même. Le log restitue des informations sur le parcours de l’utilisateur, indiquant s’il a réclamé la page d’accueil, effectué une recherche sur le site, utilisé des mots clés, consulté des documents. Il est aussi possible de savoir via quel site est arrivé l’utilisateur et d’obtenir des informations sur le navigateur utilisé.
À titre d’exemple, la bibliothèque numérique Gallica génère chaque jour 20 millions de lignes de log pour 40 000 visites.

 

La première étape consiste à éclater le fichier de log en plusieurs catégories pour les exploiter et les enrichir, par exemple en associant à l’identifiant de chaque document consulté les métadonnées qui lui correspondent2. On obtient ainsi une base de données structurée.
Concernant la bibliothèque numérique Gallica, il ressort de l’analyse de ces logs une majorité de sessions assez courtes : la plupart des visites durent moins de 2 minutes.
80% des 40 000 visiteurs consultent un seul document. Seuls 10% en consultent 5.
Les trois quarts des consultations concernent les périodiques et les monographies, ce qui correspond à la partie la plus importante du catalogue. Toutefois, le ratio entre le nombre de consultations et la présence du document dans le catalogue révèle que les utilisateurs ont une utilisation variée des documents.

Lorsque l’analyse se penche sur la question des outils de médiation, il s’avère que les utilisateurs de la page Facebook de Gallica (par ailleurs très populaire, avec 2 500 posts, 8 commentaires par post et 90 partages en moyenne) retournent peu sur le site de Gallica (il y peu de « rebonds »). Or, historiquement, il apparaît que l’équipe de Gallica a placé les liens qui mènent à Gallica dans le texte, et non dans les vignettes. Durant deux mois, un test a été mené en plaçant les liens dans les vignettes, et le résultat est sans appel : un lien placé dans le texte génère un rebond pour 300 utilisateurs, alors qu’un lien en vignette sur un post Facebook permet d’atteindre 8 000 rebonds vers Gallica !

Une démarche type « Machine Learning » a ensuite permis de modéliser les comportements des utilisateurs en faisant appel aux modèles de Markov : un algorithme a été élaboré pour obtenir une analyse prédictive des comportements à partir des données de l’état présent.
Les parcours identifiés indiquent que :
- la majorité des sessions ne commence pas par la page d’accueil de Gallica mais par Google (par consultation ou recherche : via des images par exemple, qui ramènent sur Gallica),
- les parcours se finissent souvent par une recherche sur le moteur de recherche de Gallica,
- la page Facebook de Gallica est peu utilisée.
Ainsi, les utilisateurs arrivent un peu par hasard sur Gallica, dont le site a du mal à les retenir longtemps. Proposer au cours d’une navigation Web présentant des documents de Gallica un lien direct vers Gallica pour favoriser les visites ou modifier la page d’accueil de Gallica afin de favoriser la découverte deviennent dès lors des pistes d’amélioration du service.
 

Vidéo-ethnographie et entretien d’auto-confrontation : saisir et expliciter les usages « en train de se faire »

Cette approche permet de documenter les usages de façon inédite, en rendant compte des raisonnements qui sont mis en œuvre au moment même des consultations. Le dispositif consiste en une caméra… fixée à des lunettes. La caméra filme l’écran et l’environnement dans lequel se trouve l’utilisateur, postulant par là que l’usage de Gallica est pris dans un contexte d’activité plus large qui inclut l’interface, le corps et d’autres artéfacts matériels qu’il s’agit d’identifier. Les vidéos sont ensuite visionnées avec l’utilisateur lors d’un « entretien d’auto-confrontation » : l’utilisateur produit un commentaire de son comportement sur l’écran (majoritairement sur PC mais aussi sur smartphone)3.

Deux grands axes d’analyse ont été tirés des données :

Quête, enquête et cheminement ou « comment les utilisateurs évaluent et raisonnent au cours de leur recherche »

Il ressort de l’analyse que chercher sur Gallica est un processus par tâtonnement, dans une démarche d’essai-erreur : les résultats obtenus suite à une requête donnée génèrent une première évaluation « à gros grain », qui déclenche ensuite des embranchements d’actions (nouvelle requête, sélection de documents par ouverture d’onglets, défilement de la liste des résultats, affinage par les filtres proposés à gauche, etc.) où peuvent cohabiter plusieurs motifs de comportements.

Tester les ressources de Gallica (le défilement à partir de mots-clés) avec une grande latitude semble pour les usagers un réflexe naturel qui ne suscite aucun sentiment de se perdre ou de perdre son temps : « Loin de chercher un document précis, les utilisateurs (semblent) s’orienter sur une pratique très ouverte, à partir d’un univers notionnel qu’ils savent définir au préalable et dans lequel ils veulent rester. »4

Le dispositif permet aussi de révéler les moments de bifurcation, de prolongement ou de sensation de « sur place », tels qu’ils sont formulés par les utilisateurs eux-mêmes. Un plan séquence croisé avec l’entretien d’auto-confrontation permet de montrer en quoi une première passe de résultats obtenue par un utilisateur peut ne pas le satisfaire, en quoi aussi, au détour d’un filtrage sur le type de document initialement recherché, un ensemble de documents proches mais différents remonte de la recherche et peut alors faire bifurquer l’utilisateur dans son argumentation. Quelques minutes plus tard, on pourra observer un glissement dans les manières de catégoriser ces mêmes documents. Enfin, à un moment « une saturation s’opère, entre redondance et nouvel ordre de sérendipité, on assiste à l’extinction progressive de l’intérêt pour un ensemble de documents qui, un temps, fit son office dans la dynamique de construction d’une argumentation »5.

 

Ainsi, il est clair que la liste et le document individuel sont des lieux de catégorisations fluctuantes : les postures vis-à-vis d’un document ou d’une liste de résultats changent dans le fil de l’activité de consultation, et cela en fonction des buts intermédiaires qui apparaissent en cours de recherche, ou même en raison d’un changement d’objectif principal chez l’utilisateur.

Écologie de l’usage de Gallica ou « comment les utilisateurs inscrivent l’usage de Gallica dans un contexte physique et matériel complexe, et dans un environnement de multi-activités »

L’usage de Gallica repose pour une part sur un contexte d’activité plus large qui inclut l’interface, des objets, d’autres applications, des corps, des présences. La méthode permet d’identifier et de décrire les éléments « co-structurants » des usages, tels que :
l’univers matériel et numérique dans lequel s’inscrit l’usage de Gallica, du carnet de notes près du clavier à Evernote ou Youtube,
le cadre de multi-activités et de multitâches : sollicitations impromptues, risques de distraction, basculements d’une activité à l’autre, cohabitation entre activités… qui deviennent des problèmes pratiques de délimitation et de segmentation du flux de l’activité,
les personnes présentes mentalement ou physiquement dans l’espace de participation, qui peuplent l’usage de Gallica6,
l’activité d’écriture qui lui est liée, et qui se passe dans mais surtout en dehors de Gallica, faute d’une interface adaptée.

 

L’usage de Gallica s’avère en réalité un bricolage peuplé d’objets, de personnes, de sollicitations, de basculements ou de cohabitations d’objectifs, qui ont plusieurs impacts sur la recherche. Ainsi :
- le temps de l’horloge utilisé pour mesurer ces usages traduit mal le « temps présent » dont les utilisateurs font l’expérience7,
- l’écart qu’il peut y avoir entre ce qui peut être planifié et ce qui peut finalement émerger d’une recherche (nouveau but, tâche qui demande plus d’opérations que prévues, etc.) peut être important,
- les médiations sociales, symboliques et matérielles peuvent produire de façon plus ou moins radicale des glissements de sens.

Dans cet univers protéiforme, il importe donc de préserver l’attention de l’utilisateur.
Pour ce faire, les auteurs suggèrent plusieurs pistes pour le site de Gallica. Il est proposé de :
multiplier et clarifier les « prises intuitives » pour l’exploration en prêtant une attention particulière au graphisme de l’interface, pas seulement en termes de fonction pratique mais aussi en termes d’attractivité visuelle,
renforcer la dimension d’affinage de la recherche (dans le croisement des filtres par exemple) sur la page principale de consultation. En effet, les utilisateurs préfèrent « bricoler » sur la base d’une seule et même page, plutôt que d’ouvrir une nouvelle page de recherche, ce qui correspond à une logique de réduction des coûts cognitifs,
♦ de mettre en place une option didactique qui aide le nouvel utilisateur à commencer, comme cela se fait dans des logiciels lorsqu’on les utilise pour la première fois,
♦ de penser Gallica aussi comme un espace où l’on peut écrire, sous la forme d’un carnet de notes au format .txt par exemple, car l’usage de Gallica est souvent associé une prise de notes.

La complexification progressive des usages de l’écran, comme le lien nouveau qu’il peut y avoir aujourd’hui entre usages distants et usages in situ8, posent ainsi un défi méthodologique pour qui veut saisir précisément ces pratiques sociales.
 

Pour aller plus loin...

... sur les questions méthodologiques :

EVANS, Christophe (coord.). Mener l’enquête : guide des études de publics en bibliothèque. Villeurbanne : Presses de l'Enssib, 2011. La boîte à outils : #22. ISBN 978-2-910227-89-0.
POISSENOT, Claude et RANJARD, Sophie. Usage des bibliothèques [Ressource électronique] : approche sociologique et méthodologie d'enquête. Villeurbanne : Les presses de l'Enssib, 2005. Les Cahiers de l'Enssib. ISBN 2-910227-56-1.

► MARESCA, Bruno. « Les enquêtes de fréquentation des bibliothèques publiques : à quelle méthodologie s’en remettre ? ». Bulletin des bibliothèques de France (BBF), 2006, n° 6, p. 14-19. Disponible en ligne : <http://bbf.enssib.fr/consulter/bbf-2006-06-0014-003>. ISSN 1292-8399.
► Fiche pratique de l'Enssib « Mener une étude de publics ». Fiche créée par Maïa Rosenberger et Vincent Chékib, le 25 janvier 2008. Mise à jour par Amandine Jacquet, le 23 janvier 2014.

... sur le « traking ethnographique » :
► ROSELLI, Mariangella. « Usagers et usages devant l’offre de lecture publique libre : parcours d’acculturation et formes d’appropriation lettrées ». Sociétés contemporaines, n°64, décembre 2006, p. 135-151. ISSN : 1150-1944.


1 « L'adresse IP est attribuée à chaque interface avec le réseau de tout matériel informatique (routeur, ordinateur, smartphone, modem ADSL ou modem câble, imprimante réseau, etc.) connecté à un réseau utilisant l’Internet Protocol comme protocole de communication entre ses nœuds ». Contenu soumis à la licence CC-BY-SA 3.0. Source : Article Adresse IP de Wikipédia en français (auteurs).
2 Telles que : le titre, l’auteur, la date de publication, le type de document - périodique, monographie, photographie, estampe, fascicule, partition, etc.
3 En tout, 19 vidéos ont été récoltées (elles durent entre 15 minutes et 1h00), 11 entretiens menés (de 20 minutes à 1h15) avec une dizaine de participants (4 personnes « expertes », ayant une fréquentation régulière de Gallica, et 6 personnes « novices », ayant été invitées à découvrir Gallica).
5 Nicolas Rollet, Valérie Beaudouin, Isabelle Garron, Op. Cit., p. 10.
6 « Les deux cas de présence, mentale et physique, de personnes dans l’environnement de l’utilisateur suggèrent l’idée d’un collectif-utilisateur (usership) : la coparticipation et la codestination sont des traits structurants dans l’usage de Gallica. », Op. Cit., p. 14.
7 Alfred Schütz, Le chercheur et le quotidien. Phénoménologie des sciences sociales, 1987, p. 111-115, cité par Nicolas Rollet, Valérie Beaudouin, Isabelle Garron, Op. Cit., p. 15.
8 La généralisation des usages distants pose aujourd’hui la question de la fréquentation des bibliothèques. Ce qui est paradoxal, c’est précisément que le développement exponentiel et obligé de la numérisation des collections participe lui-même d’une réduction de la fréquentation des lieux physiques. Les bibliothèques produisent par là les conditions même de cet état de fait, les obligeant alors à se réinventer.

Tags : Gallica, Usages numériques, méthodes, logs, vidéo-ethnographie, BnF

Liens réseaux sociaux