CAIRN.INFO : Chercher, repérer, avancer.

1Alors même que la « numérisation » du patrimoine écrit semble offrir aux politiques culturelles des institutions de conservation un nouvel impératif catégorique, le financement de la recherche en sciences humaines dépend, chaque jour un peu plus, de l’invention et de la constitution de corpus de « données », dont la dimension et l’extension « numérique » varient selon les disciplines et les modèles épistémologiques. Ces deux dynamiques de mutation technologique des supports et des modes de diffusion du savoir convergent-elles pour autant ? Rien n’est moins sûr, pour le moment, compte tenu de la diversité des expériences et de l’ampleur de certains malentendus. Force est de constater, en effet, que la « conversion numérique » [1][1]En référence à l’heureuse expression, à double sens, de Milad… des supports patrimoniaux, dont les archives traditionnelles sur papier font partie, et celle des outils et des produits de la recherche en sciences humaines, tout particulièrement en histoire, ne s’établit pas selon les mêmes critères, et encore moins selon les mêmes temporalités.

2 Il est ainsi désormais entendu que l’obtention du financement d’un programme de recherche collectif temporaire, notamment de l’ANR, dépend fréquemment de la mise en œuvre, et plus encore de la mise en ligne, de « données » et de « corpus », destinées à la fois à être les instruments et les résultats de l’opération de recherche elle-même.

3 En parallèle, depuis la fin de l’année 2009, le Grand emprunt national, à travers la création du « Fonds pour la société numérique » (4,25 milliards d’euros), s’est proposé de réserver une somme de 750 millions d’euros pour la numérisation des « contenus culturels ». Dans un rapport « sur la numérisation du patrimoine écrit », rendu par Marc Tessier le 12 janvier 2010 [2][2]http://www.syndicat-librairie.fr/fr/rapport_tessier_sur_la_numer…, il s’agissait de mettre une telle somme à disposition de quatre établissements publics : la Réunion des Musées nationaux, l’INA, le CNC et la Bibliothèque nationale de France. L’absence criante, au sein de ce quadrige, des institutions d’archives a été vivement remarquée et le milieu des archivistes s’est alors ému du fait que la manne étatique de l’emprunt ne s’intéresse d’aucune manière aux patrimoines archivistiques produit par l’État ou les collectivités territoriales [3][3]http://www.archivistes.org/Pas-de-revolution-numerique-sans.. Il est vrai que la lettre de mission adressée par le ministère de la Culture à Marc Tessier le 21 octobre 2009 posait explicitement l’enjeu : il s’agissait bien d’analyser et d’évaluer « la pertinence d’un éventuel partenariat entre la Bibliothèque nationale de France [i.e. Gallica] et Google Books », suite à diverses polémiques ayant vu le jour depuis 2005, visant à défendre l’exception culturelle française ou européenne.

4 Si les vertus de la mise en ligne croissante et accélérée de collections imprimées anciennes sont manifestes, le succès des bibliothèques virtuelles n’entretient pas moins une confusion quant à la possibilité même de la « grande numérisation » [4][4]Pour faire référence au titre de l’ouvrage stimulant de Lucien… des supports du savoir, et tout particulièrement des « sources originales » de la recherche historique. Au point que les institutions d’archives se trouvent désormais placées dans une position défensive, qui consiste à justifier d’un « retard » irréductible. Il n’est pas rare ainsi, en salle de lecture d’un dépôt d’archives, de devoir affronter l’exaspération du public, sous la forme, quasi messianique, d’une attente où le « tout numérique » remplit une fonction eschatologique.

5 Les lignes qui suivent n’ont d’autre but que d’essayer de comprendre pourquoi les « archives », au sens traditionnel, demeurent, en France notamment, des objets impensés, sinon délaissés des plans de numérisation de masse, alors même que tous les projets de numérisation de « données » jouent allègrement sur la confusion que ces dernières entretiennent avec la notion même d’archives, qu’elles soient numériques ou matérielles. Il s’agit donc de proposer une brève radiographie des politiques et des produits numériques portés par les services d’archives en France, en tentant de penser leur rapport avec l’évolution des pratiques historiographiques, tant en ce qui concerne les objets d’études que les mutations éventuelles des formes de travail de l’historien, du dépouillement des archives à leur instrumentation probatoire.

LES PARADOXES D’UNE INFORMATISATION PRÉCOCE : LES ARCHIVES EN FRANCE OU LE SYNDROME DU « TÔT-VENU »

6 Le modèle du « tard-venu », bien connu de l’histoire des techniques, semble offrir, en le renversant, une voie d’accès commode pour situer le problème historique du rapport des institutions d’archives publiques en France à la « numérisation ». En dépouillant systématiquement les rapports annuels de la Direction des Archives de France, imprimés entre 1974 et 2001, il apparaît que la question du traitement informatique des archives a pu constituer une préoccupation, sinon une priorité, précoce, et pour ainsi dire expérimentale, au sein des institutions d’archives. Selon une chronologie concordante avec la découverte par les historiens, au cours des années 1970, du pouvoir de mise en série des informations par l’informatique, les archivistes, dans la mesure où ils sont, dans le cadre de la collecte des archives courantes, en contact permanent avec l’évolution des pratiques et des supports du travail administratif, ont été tôt confrontés à la question du traitement des « archives informatiques ».

7 Cette sensibilité à la question du devenir des supports informatiques a pris une orientation gestionnaire, dont l’ombre portée pèse encore fortement sur la question, si difficile à résoudre, de la « numérisation » contemporaine des masses archivistiques conservées par les institutions publiques. La découverte de l’outil informatique a paru tout d’abord pouvoir résoudre un problème d’échelle dans le traitement des archives, de la collecte à la communication, en réalisant, bien avant d’autres institutions culturelles et scientifiques, un véritable gain de productivité. Cette même période correspond en effet, en France, à la massification de la collecte des archives contemporaines : du fait de la généralisation du versement systématique des ministères et des grandes administrations, rendu possible par le développement du modèle de l’archiviste « en mission » [5][5]Depuis la création de la première mission en ministère, au sein…, et par la mise en œuvre d’un grand « Centre des archives contemporaines » à Fontainebleau, à partir de 1969, les entrées annuelles d’archives publiques au niveau central, comme au niveau départemental, connaissent une croissance exponentielle [6][6]Le Centre des Archives contemporaines reçoit ainsi, pour la….

8 L’outil informatique fut donc perçu en premier lieu comme un instrument de gestion des mouvements de documents et comme un adjuvant essentiel à la collecte à grande échelle, avec la création de l’application Priam dès 1981, avant la mise en œuvre d’un « archivage automatisé des missions » (application « Aramis ») en 1988. Cette date correspond également au lancement du système « CARAN », qui accompagne l’ouverture d’un nouveau bâtiment, dédié à l’accueil du public, sur le site parisien des Archives nationales [7][7]Si son interface visuelle paraît aujourd’hui « archaïque », ce…. Ce système introduit une gestion informatisée et à distance des communications, avec réservation par Minitel dès septembre 1990, mais aussi du courrier avec les lecteurs, préfigurant à plus d’un titre ce que l’on appellerait aujourd’hui la « Gestion électronique des documents » (GED). L’engagement de la Direction des Archives de France au sein de la bulle technologique télématique alla jusqu’à la mise en place d’un réseau professionnel, prénommé « Lynx », via le même Minitel.

9 Le chassé-croisé mérite d’être signalé : l’année même où François Mitterrand lançait, le 14 juillet 1988, le projet, alors fort abstrait, de « Très grande bibliothèque » virtuelle, les Archives de France semblaient avoir pris les devants en matière de modernisation technologique. Compte tenu des coûts et des investissements engagés alors depuis une dizaine d’années, le revers se fit vite ressentir, à partir du moment où, moins de cinq ans plus tard, l’uniformisation et l’essor d’Internet condamnaient l’expérience à n’avoir été qu’une préfiguration, perçue alors comme prématurée et condamnée par la suite à s’adapter aux nouvelles normes technologiques.

10 Mais l’option dominante d’une digitalisation des circuits, et non des supports, n’avait pas empêché la mise en œuvre, dès le départ, d’un ambitieux programme de traitement informatique des données contenues dans les documents d’archives. Dès 1973, un grand chantier de bases de données, quantitatives et nominatives, avait vu le jour, avec le lancement des actuelles bases Arno (dépouillement systématique de tous les actes des notaires parisiens pour les années 1751 et 1761, étendu plus tard à l’année 1551 et à l’année 1851, soit près de 220000 actes au total), Léonore (base nominative des titulaires de la Légion d’honneur entre 1802 et 1976), Arcade (commande d’œuvres d’art par l’État entre 1800 et 1969), rejoints au début des années 1990 par les projets Nat (dossiers de naturalisation de 1814 à 1853) ou encore Prof (provisions d’offices entre 1720 et 1755). Si ces projets nominatifs pouvaient répondre à la demande sociale d’instruments généalogiques, ils n’en formaient pas moins des modes d’investigation pour la recherche au sein des fonds.

LA NUMÉRISATION AU SERVICE DE LA CONSERVATION ET DE LA DESCRIPTION DES ARCHIVES

11 Au terme de quelque vingt années d’expérimentations, la « numérisation », au sens restreint, mais dominant dans les représentations contemporaines, d’une dématérialisation des documents sous forme d’images, apparaît aux Archives nationales en 1993, avec le projet Archim[8][8]http://www.culture.gouv.fr/documentation/archim/accueil.html (« images de documents d’archives »). L’objectif répond alors essentiellement aux impératifs de l’action culturelle : il s’agit d’une exposition virtuelle de « grands » documents patrimoniaux, extraits depuis plus d’un siècle des fonds d’archives et dont la réunion forme les collections d’un « musée de l’histoire de France », développé au sein des Archives nationales depuis 1867. La « digitalisation » coïncide alors avec l’émergence de la conservation préventive des documents : elle accompagne en effet la fermeture du « musée » proprement dit, soit l’exposition permanente, et donc prédatrice, de ces mêmes documents originaux à la lumière. Contenue par des moyens internes limités, cette fonction « conservatrice » de la numérisation, héritière sur ce point du microfilmage, reste longtemps prédominante.

12 Force a été de constater combien ces expériences précoces, et inscrites de ce fait dans une histoire, certes longue, mais sans cesse rivée à sa propre actualisation technologique, avaient pu brutalement apparaître, en quelques années, comme le signe d’une inadaptation, ou pire d’une lacune difficile à combler. Dès 1997, le constat d’un double retard par rapport aux institutions étrangères d’archives et par rapport aux autres « secteurs patrimoniaux » était dressé, à l’occasion d’une journée d’études dédiée à « la numérisation au service de la préservation et de la valorisation des archives » [9][9]Voir l’introduction de Gérard ERMISSE dans La numérisation au….

13 Sept ans plus tard, le constat était tout aussi radical : « Les Archives nationales se doivent de rattraper leur retard dans ce domaine grâce à la mise en œuvre d’un véritable plan de numérisation des instruments de recherche et de certains fonds particulièrement fragiles, précieux ou très consultés ; cela afin d’améliorer la conservation de ces archives et de les mettre à la disposition directe des chercheurs » [10][10]Gérard ERMISSE, dans l’introduction à Centre historique des…. L’ensemble des expériences menées depuis trente ans était qualifié comme répondant à « une logique de recherche-développement » ; il était alors temps « d’entrer dans une logique de réalisation et de production ».

14 Or l’année 2004 correspond précisément au lancement du vaste projet de refondation du service des Archives nationales, à partir de la construction d’un nouveau centre à Pierrefitte-sur-Seine. Le « chantier de dématérialisation » alors mis en route, et qui sera achevé au cours de l’année 2012, concerne, non pas la digitalisation des archives elles-mêmes, mais bien celle de l’ensemble des instruments de recherche qui permettent d’y accéder, soit, pour les archives conservées à Paris et Fontainebleau, quelques 23500 « inventaires » et bordereaux de versement, représentant 1,2 million de pages de texte et quelques 3 millions de fiches [11][11]http://www.archivesnationales.culture.gouv.fr/pierrefitte/chanti…. Encodé et hiérarchisé selon les normes de description internationales, cet ensemble de « données » ne forme donc pas une information « immédiate », mais bien la clef d’accès à près de 300 km de papier, dont la digitalisation directe est économiquement impossible et surtout inutile à envisager.

DES POSITIONS INVERSÉES : ARCHIVISTES ET BIBLIOTHÉCAIRES FACE À LA FIN DU PAPIER

15 C’est en effet sur la question de la masse d’informations disponibles que le malentendu entre les institutions d’archives et leur public éventuel atteint son point maximal. Et tout particulièrement dans la comparaison sans cesse établie par les usagers avec la sphère des bibliothèques. La conversion numérique des ouvrages sous forme de bibliothèque virtuelle ne remet pas en cause le modèle du livre [12][12]Pour une réflexion en la matière, voir Robert DARNTON, Apologie…. On pourrait même soutenir le fait qu’elle renforce au contraire son « autorité », au double sens du terme. En effet, la conséquence immédiate et observable de la numérisation de masse du patrimoine imprimé demeure, jusqu’à présent, le renforcement du droit d’auteur. Ainsi, la digitalisation des livres sur papier pourrait être perçue comme une démarche visant à préserver l’existence du livre lui-même, en tant qu’objet : le livre numérique reste un livre numérisé. Dans la mesure où l’indexation constitue, au sein de l’espace digital, et tout particulièrement sur Internet, le mode d’accès dominant à l’information, il paraît évident que le modèle triomphant d’accès au savoir numérique est bien celui du catalogue de bibliothèque, et non celui de l’inventaire d’archives.

16 À l’inverse, dans la mesure où ils ont été submergés dès la fin des années 1970 par le papier, les archivistes n’ont cessé d’appeler de leurs vœux la dématérialisation des archives, la disparition du papier, et donc la prise en compte de l’archivage « nativement numérique ». C’est ce qui explique pourquoi l’essentiel de l’effort engagé par la logique de « recherche-développement » évoquée ci-dessus a porté sur l’anticipation de solutions permettant d’envisager la conservation pérenne des documents numériques. Dès 1985, le centre de Fontainebleau lançait le programme « Constance » visant à l’archivage des grandes bases de données quantitatives informatiques de l’État, comme celles produites dans le cadre des enquêtes statistiques de l’INSEE. C’est ainsi qu’au sein du service technique de la Direction des Archives de France une réflexion précoce a vu le jour au cours des années 1990 pour proposer des solutions techniques d’archivage électronique durable. Une méthodologie, des prescriptions, sinon des normes, ont ainsi pu être élaborées [13][13]Voir ainsi Catherine DHÉRENT, Les archives électroniques.… : elles sont désormais progressivement mises en pratiques au sein même des institutions publiques, et plus encore dans le monde des entreprises.

17 À l’opposé, on peut remarquer que c’est précisément parce que le livre demeure avant tout un objet commercial, à l’inverse du document d’archives, que son existence « nativement numérique » est encore loin d’être à l’ordre du jour, y compris dans le cadre du dépôt légal. Sur ce point, l’enregistrement, sinon la collecte, des livres numériques d’ores et déjà existants s’effectue paradoxalement par échantillonnage, dans la mesure où il passe par l’intermédiaire de la capture automatique des sites Web [14][14]Voir le développement de la question du dépôt légal des livres…. Les positions sont donc radicalement inversées : tout se passe comme si les institutions d’archives accompagnaient, voire tentaient d’anticiper, la « révolution numérique » au niveau de ses supports de production, tout en étant incapables de rivaliser avec ses principaux modes de diffusion [15][15]Pour une synthèse sur la question des principes de l’archivage….

18 On parvient ainsi à ce paradoxe : partisans d’une numérisation radicale à l’amont de la production, les archivistes se trouvent devoir s’adapter à l’aval au mode d’accès dominant aux supports dématérialisés qui, du moteur de recherche « plein texte » au thesaurus de mots-clefs, reproduisent de près ou de loin le modèle du catalogue de bibliothèque. Or le principe même de « respect des fonds », c’est-à-dire du critère de provenance, dans le mode d’organisation et de répartition des archives, résiste à la réduction thématique que toute logique d’indexation suppose. Il semble ainsi que l’entrée dans l’ère numérique provoque le rejeu d’une vieille confrontation entre les deux grands modes de classement du savoir que forment principe de pertinence et principe de provenance.

19 Le triomphe du modèle intellectuel de la bibliothèque et de la logique des « autorités » textuelles dans la sphère numérique est redoublé par les contraintes que le marché et l’économie de la « numérisation » font peser sur la transformation des supports traditionnels. Le livre ne constitue pas seulement la structure inconsciente du savoir numérique : il en est l’agent formel et la norme économique, dans la mesure où, matériellement, le recueil relié demeure le modèle dominant des opérations massives de digitalisation, y compris au sein des services d’archives.

LA PREUVE PAR LE REGISTRE OU LES PRIVILÈGES DU RECUEIL SUR LE CARTON

20 L’enquête menée par le Service interministériel des Archives de France (qui a succédé depuis janvier 2010 à l’ancienne Direction des Archives de France) sur « les archives en ligne en quelques chiffres » [16][16]http://www.archivesdefrance.culture.gouv.fr/ressources/en-ligne/… fait apparaître une orientation matérielle majeure quant à la nature des supports privilégiés par les opérations de numérisation depuis une dizaine d’années dans les institutions d’archives publiques (archives municipales, départementales et nationales). Les premières mises en ligne remontent à l’année 2003 [17][17]Les quatre premiers départements à s’engager sur cette voie…. Si le chiffre monumental de 174 millions de pages d’archives en ligne permet de contredire l’impression de « retard » historique signalé plus haut [18][18]Impression de « rattrapage » tout récemment relevée dans le…, la ventilation typologique des documents au sein des services départementaux (voir tableau ci-dessous) permet de souligner une tendance dominante en matière formelle : en distribuant les types documentaires (colonne 2) selon le critère de leur support matériel (colonne 1, reliés ou non sous forme de registre), on obtient un déséquilibre manifeste entre les archives « reliées » et les archives « en pièces détachées », en faveur des premières.

DOCUMENT 1

Opérations de numérisation en départements. Bilan et ventilation typologique (au 8 décembre 2010)

Aspect formel Typologie documentaire Nombre et %
de départements
concernés
Nombre de pages
numérisées
Documents non reliés Archives publiques variées 21 22 % 2003305 1,2 %
Fonds et collections privés 12 12,6 % 174399 0,1 %
Documents reliés
et registres
Registres d’état civil 65 68,4 % 150072443 89,1 %
Recensements et matricules 34 35, 7 % 8296422 4,9 %
Enregistrement (hypothèques, etc.) 11 11,5 % 3009322 1,8 %
Minutes de notaires 8 8, 4 % 1602958 1 %
Cartulaires 8 8,4 % 53591 0,03 %
Documents
iconographiques
Cadastres et plans 53 55,7 % 1110458 0,7 %
Iconographie et photographies 38 40 % 440466 0,27 %
Documents imprimés Journaux et presse locale 11 11,5 % 1561854 0,9 %
Total 168355218 100 %
figure im1

Opérations de numérisation en départements. Bilan et ventilation typologique (au 8 décembre 2010)

21 Les documents existant sous forme de registres ou de recueil représentent en effet plus de 48 % des opérations de numérisation, mais constituent 97 % du bilan total des pages numérisées (soit 163 millions), alors que les documents iconographiques (affiches, cartes postales, photographies, plans, notamment cadastraux) constituent – pour des raisons attractives, car précisément « visuelles », évidentes – près de 35 % des opérations de numérisation dans ces mêmes services d’archives départementaux, pour 1,5 million de clichés au total.

22 Il va de soi qu’il s’agit uniquement ici de tendances approximatives, mais qui n’en demeurent pas moins sous-tendues par une politique très claire, et dominante dans les départements : dès le début des années 2000, la question de la mise en ligne des registres de l’état civil qui, à eux seuls, représentent plus de 89 % de la masse numérisée totale, pour une couverture territoriale de près de 70 % des départements, est apparue comme le principal objectif des services d’archives. Cette injonction, répondant à une demande sociale majeure, en lien avec les recherches généalogiques, s’était déjà fait ressentir depuis les années 1960 par le microfilmage systématique d’une partie de ces mêmes registres (ce qui a facilité d’autant la numérisation, le microfilm pouvant servir de support de digitalisation), par ailleurs potentiellement fort détériorés car très consultés. Les autres documents privilégiés par les opérations de numérisation, comme les matricules militaires, les registres de recensement de la population, ou encore certains registres de minutes notariales, constituent également des sources d’appoint de la recherche nominative qui fait le cœur de la démarche généalogique. Lorsqu’il ne s’agit pas de documents d’archives au service de l’histoire des familles, les documents numérisés en priorité depuis dix ans concernent l’histoire de la propriété personnelle (hypothèques ou plans cadastraux par exemple).

23 Que la numérisation des archives réponde à la demande sociale de « généalogie » n’est pas une découverte. On peut toutefois, ici encore, souligner la différence de position des services d’archives, en comparaison des bibliothèques : du fait même des contraintes chronologiques imposées par le respect du droit d’auteur (en France, pour simplifier, 70 ans après la mort de l’auteur), redoublé par les droits éventuels des éditeurs sur les impressions, le « patrimoine écrit » mis en ligne a eu tendance, au moins dans sa première phase de développement, à correspondre aux attentes d’un public plutôt spécialisé, sinon savant.

À LA RECHERCHE D’UN MODÈLE DE FINANCEMENT

24 Il se trouve ici que deux facteurs se croisent et se cumulent pour expliquer la surreprésentation des documents sous forme « registrée » : le marché même de la « conversion » numérique, c’est-à-dire de la digitalisation concrète des supports, fixe des prix très inférieurs pour tout type d’objet numérisable se présentant sous la forme d’un livre-registre, c’est-à-dire d’un objet paginé, au format calibré, et qui offre une complète équivalence avec le livre. Il y a là une question de procès matériel très concret : la manipulation des objets patrimoniaux non « reliés » suppose un surcoût important, ne serait-ce que du fait de la variation des formats, l’automatisation de la saisie étant le critère principal de variation des coûts [19][19]Pour une présentation synthétique du « coût de la…. Cette dernière est très importante, de 0,05 euros la page pourune numérisation de masse (avec massicotage sinon destruction du support d’origine) jusqu’à 3 euros la page pour une manipulation précieuse et de fortes variations de format, soit une échelle de variation de 1 à 60 !

25 Il faut noter que la captation numérique d’images est essentiellement réalisée par des sociétés privées spécialisées qui fixent les tarifs en fonction de la demande dominante, constituée par le livre imprimé. Ceci explique pourquoi il est plus simple et économique d’envisager de numériser des ensembles sériels d’archives qui se présentent sous forme de recueils paginés, comme le sont typiquement les registres d’état civil. Au-delà des normes du marché, ainsi que le remarque Milad Doueihi, « la technologie numérique est assez puissante pour reproduire une image des textes, mais ne peut pas encore reproduire la texture » [20][20]M. DOUEIHI, La grande conversion…, op. cit. (rééd. Seuil,…. La spécificité d’un fonds d’archives réside précisément dans le lien organique, archéologique et tridimensionnel, qui associe les documents au sein d’un fonds dont la structure repose sur ces mêmes articulations irréductibles, matérielles et non systématiques. La logique de l’indexation documentaire, qui gouverne l’espace d’investigation et de « moissonnage » des informations contenues dans les textes, peine à restituer la texture structurelle des objets archivistiques. La transcription numérique de liens entre les documents et les dossiers, dont l’arborescence est nécessairement complexe et surtout variable à l’infini, exige de fait un traitement spécifique, par l’intermédiaire de la fabrication de « métadonnées » en interrelations, ce qui augmente d’autant le coût du produit final.

26 Les dossiers d’archives « classiques » se caractérisent en effet par leur grande hétérogénéité matérielle, notamment lorsqu’il s’agit d’archives personnelles : pour prendre un seul exemple, relevons le fait que la numérisation, poursuivie par l’Université hébraïque de Jérusalem en mars 2011, du fonds d’archives d’Albert Einstein (80000 documents) est évaluée à quelques 500000 dollars [21][21]Cf.…, soit plus de 6 euros par document… et un peu plus de 5 % du budget total réservé à la numérisation des « contenus culturels » du « Fonds pour la société numérique » évoqué plus haut. Le rapport de coût est saisissant : la Bibliothèque nationale de France annonce numériser, grâce au plan de 2009, plus de 500000 ouvrages épuisés du XXe siècle, là où le même investissement ne permettrait que de numériser une dizaine, voire une vingtaine de fonds d’archives originaux.

27 L’enjeu fondamental reste bien l’invention d’un modèle économique de financement de cette numérisation coûteuse portant sur des biens culturels qui, à l’inverse du livre, ne sont pas, pour l’essentiel, des objets commerciaux [22][22]Pour une référence récente sur les spécificités de l’économie…. Dans la mesure où l’État n’a pas fait le choix d’investir dans ce qui serait l’équivalent d’un « Atelier national de numérisation du patrimoine » (à l’inverse de ce qui préexistait pour le microfilmage), et où le secteur est essentiellement animé par des sociétés privées, il n’y a pas pour le moment de véritables solutions en dehors de la consultation payante, pratiquée par exemple par le Public Record Office britannique [23][23]http://www.nationalarchives.gov.uk/records %5Cdefault.htm. : une page du célèbre Domesday Book de 1086, soit le plus ancien « record » de la couronne d’Angleterre, coûte en moyenne 2 livres sterling. C’est précisément cette question du financement indirect de la numérisation par le biais de la concession de licences d’exploitation d’archives numérisées, sommairement assimilées à des « données publiques », qui a fait l’objet d’une vive polémique, suscitée par le rapport « Partager notre patrimoine culturel » de mai 2009 [24][24]http://lesrapports.ladocumentationfrancaise.fr/BRP/104000652/000…. Si l’investigation généalogique est susceptible d’alimenter un marché d’informations commercialisables, cela n’est a priori pas le cas pour la recherche, du moins pour le moment.

SOURCES NUMÉRISÉES ET PRATIQUES HISTORIOGRAPHIQUES : DE L’ÉVITEMENT AU PARTENARIAT ?

28 Il est certainement encore trop tôt pour mesurer les éventuels effets historiographiques d’une quelconque mise en ligne du patrimoine archivistique numérisé. On peut constater toutefois, sur le mode de la boutade, que la mise en ligne quasi intégrale des registres paroissiaux et de l’état civil du XVIe au XIXe siècle n’a pas relancé la démographie historique de l’époque moderne et contemporaine… Plus sérieusement, il est fort probable que la dématérialisation de tout ou partie d’un fonds d’archives tend à le transformer en source d’appoint, sinon en instrument de travail, répondant à des requêtes complémentaires, mais non aux attendus d’une étude monographique à part entière. De même qu’un texte mis en ligne rend son plagiat plus facile à détecter, une source originale mise en ligne ne favorise pas son appropriation dans le cadre d’une recherche « inédite ». Dans la mesure où le métier d’historien, à travers le rituel du « dépouillement », demeure fondé sur une tension entre l’inconnu des sources et le connu de la bibliographie, entre la découverte archivistique et l’héritage historiographique, la conversion numérique des archives prend davantage l’apparence d’une dynamique d’édition de « Monuments », dont la fonction scientifique et la dimension identitaire, sinon mémorielle, sont étroitement mêlées. La numérisation des fonds d’archives emprunte les apparences du dévoilement spectaculaire, bien davantage que celles de l’interprétation analytique. Tout se passe comme si ces immenses fac-similés numériques étaient destinés à jouer le même rôle que la célèbre collection des Documents inédits de l’Histoire de France : la mise en ligne des registres de délibérations de telle ou telle municipalité, des « origines » (tardo-médiévales) à nos jours, partage une singulière parenté, à l’ère de la décentralisation et de la redécouverte des identités locales, avec les Monuments inédits pour l’histoire du Tiers État d’Augustin Thierry. La publication (inachevée) de ces derniers en pleine monarchie de Juillet n’a pas pour autant provoqué la naissance de l’histoire sociale.

29 Au contraire peut-on même supposer que le fonds numérisé, en dehors de ceux qui conduisent son projet d’exploitation (on pense ainsi au très beau projet précurseur, car mis en ligne dès 1999, de Pietro Corsi autour des manuscrits de Lamarck), risque de faire l’objet d’une sorte d’évitement historiographique. Là encore, la comparaison avec le patrimoine archivistique édité, a fortiori à haute-époque, peut suggérer des pistes : l’édition pré-scientifique du Procès des Templiers par Michelet en 1841 n’a pas empêché l’historiographie templière de dériver depuis 150 ans vers des narrations légendaires, sans pour autant s’attaquer à la question technique et juridique du procès lui-même [25][25]Pour une mise au point récente de l’ombre portée des sources….

30 Consacrant le partage administratif entre les supports dématérialisés du patrimoine et les instruments scientifiques qui les mettent en valeur, le développement de l’instrument numérique ne tendrait-il pas, au moins provisoirement, à creuser l’écart entre les fonctions identitaires et collectives de la mémoire documentaire et ses usages scientifiques potentiels ? Alors même que la mise en ligne croissante de « bibliothèques virtuelles », de Gallica à Persée, détermine un nouvel espace d’accès au savoir imprimé, les institutions d’archives traditionnelles ne disposent pas (encore ?) des moyens financiers qui leur permettraient de transformer leurs ressources en données normalisées et exploitables par requêtes, exception faite peut-être des séries nominatives quantitatives qui, à l’image de l’état civil, répondent massivement à la demande sociale de données généalogiques.

31 Les expériences, parfois anciennes en la matière, semblent peu à peu disqualifiées par la difficulté à prendre en compte le caractère irréductible et lacunaire des objets archivistiques, non saisissables par les « autorités » qui commandent le catalogage bibliographique traditionnel, devenu depuis lors le critère principal de description des objets numériques. À l’inverse d’un livre ou d’une collection consciemment constituée – de livres, de photographies, d’objets –, la constitution et la transmission des « fonds d’archives » ne procèdent pas de logique de l’auctorialité textuelle, mais relève d’une production complexe, qui associe et mêle sans cesse les traces d’une action, passée ou à venir, aux objets qui la rendent possible.

32 Reste à savoir si les nouvelles structures d’organisation de la recherche, inscrites dans une temporalité brève, suscitée par la logique du financement sur projet, seront susceptibles de bâtir de véritables partenariats scientifiques et techniques durables avec ces mêmes institutions-réservoirs d’archives non encore transformées en « données ». En vue d’éviter la formation d’une logique de nivellement numérique, par la prolifération d’un espace non hiérarchisé de références, sur le modèle du catalogue thématique, source d’illusions d’optique, sinon d’effets de présence, il est donc urgent de distinguer les notions de corpus de données et d’archives. Le développement de grands équipements, comme le TGE Adonis, chargés de « moissonner » les données en vue de constituer une interface privilégiée d’accès à « l’information », ont sur ce point un rôle stratégique, quoique fort délicat à jouer [26][26]Voir l’article de Jean-Luc PINOL dans ce numéro, p. 90-100..

33 En attendant qu’un nouvel agencement puisse s’établir entre science et patrimoine, entre agriculture des données et sylviculture des archives, une autre numérisation a déjà commencé dans l’ambiance feutrée des salles de lecture des dépôts d’archives. Celle-là est réalisée au quotidien par des centaines d’appareils photographiques personnels, dont le cliquetis automatique constitue désormais la symphonie discrète d’un « dépouillement » qui ne berce plus le silence des archives de la même manière. Tel un chasseur-cueilleur numérique, l’historien engrange, non plus des fiches, mais l’image des documents eux-mêmes, associant ou reconstituant des fragments de fonds entiers. Les récoltes personnelles ainsi menées constituent autant de « corpus » d’archives dispersés, dont la mise en œuvre, du nommage des fichiers à leur articulation en « dossiers » en partie factices, est établie par chacun dans l’intimité fragile de son disque dur. Si cette « conversion numérique », faussement sauvage, tend à restreindre le temps de présence aux « Archives », elle offre les moyens d’une nouvelle mutualisation des recherches par la mise en relation de petites granges domestiques, qui formeraient les assises d’un « grenier de l’histoire » virtuel. En reconfigurant le mode d’appropriation des objets archivistiques, cette « cueillette » numérique a le pouvoir d’en réduire la dispersion alors même qu’elle ne cesse de déplacer le temps d’analyse des sources et de différer l’économie de leur citation jusqu’au moment même de la synthèse. Au point de faire trembler les frontières entre l’identification, la transcription, et l’édition de « pièces justificatives », susceptibles de submerger le discours lui-même. Là réside sans aucun doute le ferment d’une mutation sans précédent des pratiques, non seulement de lecture des documents, mais d’écriture même de l’histoire.

Notes

  • [1]
    En référence à l’heureuse expression, à double sens, de Milad DOUEIHI, dans La grande conversion numérique, Paris, Seuil, 2007.
  • [2]
    http://www.syndicat-librairie.fr/fr/rapport_tessier_sur_la_numerisation_du_patrimoine_ecrit. Toutes les URL citées dans cet article ont été vérifiées le 15 novembre 2011.
  • [3]
    http://www.archivistes.org/Pas-de-revolution-numerique-sans.
  • [4]
    Pour faire référence au titre de l’ouvrage stimulant de Lucien X. POLASTRON, La grande numérisation. Y a t-il une pensée après le papier ?, Paris, Denoël, 2006.
  • [5]
    Depuis la création de la première mission en ministère, au sein du ministère de l’Intérieur en 1952.
  • [6]
    Le Centre des Archives contemporaines reçoit ainsi, pour la seule année 1982, plus de 20 km d’archives publiques collectées dans l’ensemble des ministères. Rappelons, par comparaison, que l’ensemble des archives centrales de l’État (hors les trois ministères des Affaires étrangères, de la Défense et de l’Économie) conservées pour la période antérieure à 1940 sur le site historique de Paris représentent environ 60 km.
  • [7]
    Si son interface visuelle paraît aujourd’hui « archaïque », ce système a eu le mérite d’une certaine « adaptabilité », dont sa longévité témoigne, dans la mesure où il est encore en service, jusqu’au déploiement dans les mois à venir du nouveau « Système d’information archivistique » (SIA) des Archives nationales et sa « salle des inventaires virtuelle », ouverte depuis le mois de novembre 2011 pour le site de Fontainebleau (cf. http://sia.archivesnationales.culture.fr/siv/accueil/saisieDemande.action).
  • [8]
    http://www.culture.gouv.fr/documentation/archim/accueil.html
  • [9]
    Voir l’introduction de Gérard ERMISSE dans La numérisation au service de la préservation et de la valorisation des archives. Journée d’études de la Direction des Archives de France (Châlons-en-Champagne, 25-27 juin 1997), Paris, Direction des Archives de France, 1998, p. 7-14, ici p. 7-8.
  • [10]
    Gérard ERMISSE, dans l’introduction à Centre historique des Archives nationales. Rapport annuel 2004, Paris, 2005, p. 10.
  • [11]
    http://www.archivesnationales.culture.gouv.fr/pierrefitte/chantier-dematerialisation.html
  • [12]
    Pour une réflexion en la matière, voir Robert DARNTON, Apologie du livre. Demain, aujourd’hui, hier, Paris, Gallimard, 2011, et plus récemment encore, dans le domaine français, François BON, Après le livre, Paris, Seuil, 2011.
  • [13]
    Voir ainsi Catherine DHÉRENT, Les archives électroniques. Manuel pratique, Paris, La Documentation française, 2002 (aujourd’hui épuisé) et Françoise BANAT-BERGER, Laurent DUPLOUY et Claude HUC, L’archivage numérique à long terme. Le début de la maturité ?, Paris, La Documentation française, 2009.
  • [14]
    Voir le développement de la question du dépôt légal des livres numériques sur le site de la BNF http://www.bnf.fr/fr/professionnels/depot_legal/a.dl_livres_mod.html : « Cas particulier des livres numériques. Le dépôt légal concerne également les e-books ou livres numériques, termes utilisés pour désigner un objet numérique ressemblant en partie à une monographie imprimée sur papier et diffusé en ligne. Seul le contenu (le texte numérique ainsi que les fonctions d’annotation, les outils interactifs, etc.) est visé par le dépôt légal, et non l’outil de lecture ou tablette. Les modalités de dépôt sont celles du dépôt légal de l’Internet, prévues par le Code du patrimoine. L’éditeur n’a aucune démarche active à effectuer auprès de la BnF. En effet, la Bibliothèque réalise des collectes automatiques grâce à des robots. Compte tenu de la masse d’informations disponible sur l’Internet, elle procède par échantillonnage, selon des critères visant à assurer la meilleure représentativité possible de ses collections. Si la diffusion d’un livre numérique coexiste avec une version sur support papier ou électronique, celle-ci reste soumise à l’obligation de dépôt légal. Un type de dépôt ne se substitue pas à un autre ».
  • [15]
    Pour une synthèse sur la question des principes de l’archivage nativement numérique, voir Françoise BANAT-BERGER, « Les archives et la révolution numérique », Le Débat, 158, 2010, p. 70-82.
  • [16]
    http://www.archivesdefrance.culture.gouv.fr/ressources/en-ligne/chiffres-clefs/ (à la date du 8 décembre 2010).
  • [17]
    Les quatre premiers départements à s’engager sur cette voie furent la Mayenne, la Savoie, les Yvelines et la Vendée.
  • [18]
    Impression de « rattrapage » tout récemment relevée dans le manuel de synthèse et d’introduction à la question des archives, entièrement revu et augmenté, de Vincent DUCLERT et Sophie CŒURÉ, Les archives, Paris, La Découverte, 2011, p. 90.
  • [19]
    Pour une présentation synthétique du « coût de la numérisation », voir par exemple Isabelle WESTEEL et Jean-François MOUFFLET, « La conduite d’un projet de numérisation », in Thierry CLAERR et I. WESTEEL (éd.), Manuel de la numérisation, Paris, Éditions du Cercle de la Librairie, 2011, p. 83-148, ici p. 110.
  • [20]
    M. DOUEIHI, La grande conversion…, op. cit. (rééd. Seuil, « Points », 2011, p. 212).
  • [21]
    Cf. http://www.sobookonline.fr/actu-ebooks/acteurs/luniversite-hebraique-de-jerusalem-va-numeriser-les-archives-deinstein/.
  • [22]
    Pour une référence récente sur les spécificités de l’économie numérique des produits culturels commerciaux, voir Philippe CHANTEPIE et Alain LE DIBERDER, Révolution numérique et industries culturelles, Paris, La Découverte, 2010.
  • [23]
    http://www.nationalarchives.gov.uk/records %5Cdefault.htm.
  • [24]
    http://lesrapports.ladocumentationfrancaise.fr/BRP/104000652/0000.pdf.
  • [25]
    Pour une mise au point récente de l’ombre portée des sources sur la question, voir Julien THÉRY, « Une hérésie d’État. Philippe le Bel, le procès des “perfides templiers” et la pontificalisation de la royauté française », Médiévales, 60, 2011, p. 157-185.
  • [26]
    Voir l’article de Jean-Luc PINOL dans ce numéro, p. 90-100.
Yann Potin
Suivre cet auteur Voir toutes ses publications
Archives nationales – Section du XIXe e siècle 60 rue des Francs-Bourgeois 75003 Paris
potin.yann@gmail.com
Dernière publication diffusée sur Cairn.info ou sur un portail partenaire
Mis en ligne sur Cairn.info le 29/02/2012
https://doi.org/10.3917/rhmc.585.0057
Pour citer cet article
Potin Yann, « Institutions et pratiques d'archives face à la « numérisation ». Expériences et malentendus », Revue d’histoire moderne & contemporaine, 2011/5 (n° 58-4bis), p. 57-69. DOI : 10.3917/rhmc.585.0057. URL : https://www.cairn.info/revue-d-histoire-moderne-et-contemporaine-2011-5-page-57.htm
Distribution électronique Cairn.info pour Belin © Belin. Tous droits réservés pour tous pays. Il est interdit, sauf accord préalable et écrit de l’éditeur, de reproduire (notamment par photocopie) partiellement ou totalement le présent article, de le stocker dans une banque de données ou de le communiquer au public sous quelque forme et de quelque manière que ce soit.
keyboard_arrow_up
Chargement
Chargement en cours.
Veuillez patienter...