NEF - Le Livre 010101 de Marie Lebert - Enquête

Le Livre 010101: Enquête (2001)
11. Bibliothèques "en dur" et bibliothèques numériques

11.1. Du bibliothécaire au cyberthécaire
11.1.1. Le Projet Gutenberg
11.1.2. The On-Line Books Page
11.1.3. La Bibliothèque électronique de Lisieux
11.1.4. La médiathèque de l'Institut Pasteur
11.1.5. Le centre de documentation de l'Organisation de coopération et de développement économiques (OCDE)
11.1.6. Le centre de documentation de l'Institut d'études politiques (IEP) de Grenoble
11.1.7. La bibliothèque de l'Ecole nationale supérieure de statistique et d'économie appliquée (ENSEA) d'Abidjan
11.1.8. L'association Juriconnexion (documentation juridique)
11.1.9. La médiathèque de l'Institut français de Londres
11.2. Numérisation en mode texte et en mode image
11.3. Les bibliothèques traditionnelles sont-elles menacées?


11.1. Du bibliothécaire au cyberthécaire

Sur une ancienne version de son site web (1998), la British Library définissait la bibliothèque numérique comme une entité résultant de l'utilisation des technologies numériques pour acquérir, stocker, préserver et diffuser des documents qui sont soit publiés directement sous forme numérique, soit numérisés à partir d'un document imprimé, audiovisuel ou autre. Une collection numérique devient une bibliothèque numérique quand elle répond aux quatre facteurs suivants: 1) elle peut être créée et produite dans un certain nombre d'endroits différents, mais elle est accessible en tant qu'entité unique, 2) elle doit être organisée et indexée pour un accès aussi facile que possible à partir du lieu de base où elle est produite, 3) elle doit être stockée et gérée de manière à avoir une existence assez longue après sa création, 4) elle doit trouver un équilibre entre le respect du droit d'auteur et les exigences universitaires.

Choisies pour leur intérêt et leur variété, voici quelques expériences: le Projet Gutenberg, projet pilote en ligne depuis 1991 (11.1.1); The On-Line Books Page (11.1.2), en ligne depuis 1993; la Bibliothèque électronique de Lisieux, en ligne depuis 1996 (11.1.3); la médiathèque de Institut Pasteur, en ligne depuis 1996 (11.1.4); le centre de documentation de l'Organisation de coopération et de développement économiques (OCDE), en ligne interne depuis 1996 (11.1.5); le centre de documentation de l'Institut d'études politiques (IEP) de Grenoble, en ligne depuis 1998 (11.1.6); la bibliothèque de l'Ecole nationale supérieure de statistique et d'économie appliquée (ENSEA) d'Abidjan, en ligne depuis 1999 (11.1.7) ; l'association Juriconnexion (documentation juridique), en ligne depuis 1999 (11.1.8); la médiathèque de l'Institut français de Londres, en ligne depuis 2000 (11.1.9)

11.1.1. Le Projet Gutenberg

Projet pionnier, le Projet Gutenberg a inspiré bien d'autres bibliothèques numériques depuis. Il débute en 1971 quand Michael Hart, étudiant à l'Université d'Illinois, reçoit un compte de 100 millions de dollars de "temps machine" dans le laboratoire informatique (Materials Research Lab) de son université. Il décide aussitôt de consacrer ce crédit à la recherche et au stockage des oeuvres du domaine public disponibles dans les bibliothèques. Il décide aussi de stocker les textes électroniques de la manière la plus simple possible, au format ASCII, avec des lettres capitales pour les termes en italique, gras ou soulignés, afin qu'ils puissent être lus sans problème quels que soient la machine et le logiciel utilisés. Peu après, il définit la "mission" du Projet Gutenberg: mettre à la disposition de tous le plus grand nombre possible d'oeuvres du domaine public. Travailleur acharné, il décide de dédier toute sa vie à son projet, qu'il voit comme étant à l'origine d'une révolution néo-industrielle.

Lorsque l'utilisation du web se généralise, le projet trouve un second souffle, et un rayonnement international. Les collections se chiffrent maintenant à 3.700 oeuvres (chiffres de juillet 2001) qui, au fil des années, ont été patiemment numérisées en mode texte par des volontaires de nombreux pays (600 volontaires actifs en 2000). Un total de 1.000 nouveaux livres devrait être traité en 2001. Cinquante heures environ sont nécessaires pour sélectionner, scanner, corriger et mettre en page un texte électronique. Un ouvrage de taille moyenne - par exemple un roman de Stendhal ou de Jules Verne - est composé de deux fichiers ASCII. Si certains documents anciens sont parfois saisis ligne après ligne, le plus souvent parce que le texte original manque de clarté, les oeuvres sont en général scannées en utilisant un logiciel OCR (optical character recognition), puis elles sont relues et corrigées à double reprise, parfois par deux personnes différentes. D'abord essentiellement anglophones, les collections deviennent peu à peu multilingues.

"Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier, explique Michael Hart. Le seul point commun est que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d'enseignement. (...) Ma carrière n'aurait pas existé sans l'internet, et le Projet Gutenberg n'aurait jamais eu lieu... Vous savez sûrement que le Projet Gutenberg a été le premier site d'information sur l'internet. Mon projet est de mettre 10.000 textes électroniques sur l'internet. Si je pouvais avoir des subventions importantes, j'aimerais aller jusqu'à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques au lieu d'un milliard seulement. (...) J'introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible."

11.1.2. The On-Line Books Page

Autre projet pilote à l'époque, The On-Line Books Page répertorie plus de 12.000 textes électroniques d'oeuvres anglophones en accès libre sur le web. John Mark Ockerbloom, qui est à l'époque étudiant à l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie), débute ce répertoire en 1993 dans le cadre du site web du département d'informatique, dont il est le webmestre.

"J'étais webmestre ici pour la section informatique du CMU (Carnegie Mellon University), et j'ai débuté notre site local en 1993, raconte John Mark Ockerbloom en septembre 1998. Il comprenait des pages avec des liens vers des ressources disponibles localement, et à l'origine The On-Line Books Page était une de ces pages, avec des liens vers des livres mis en ligne par des collègues de notre département (par exemple Robert Stockton, qui a fait des versions web de certains textes du Projet Gutenberg). Ensuite les gens ont commencé à demander des liens vers des livres disponibles sur d'autres sites. J'ai remarqué que de nombreux sites (et pas seulement le Project Gutenberg ou Wiretap) proposaient des livres en ligne, et qu'il serait utile d'en avoir une liste complète qui permette de télécharger ou de lire des livres où qu'ils soient sur l'internet. C'est ainsi que mon index a débuté. J'ai quitté mes fonctions de webmestre en 1996, mais j'ai gardé The On-Line Books Page, parce que, entre temps, je m'étais passionné pour l'énorme potentiel qu'a l'internet de rendre la littérature accessible au plus grand nombre. Maintenant il y a tant de livres mis en ligne que j'ai du mal à rester à jour (en fait j'ai beaucoup de retard). Mais je pense pourtant continuer cette activité d'une manière ou d'une autre. Je suis très intéressé par le développement de l'internet en tant que médium de communication de masse dans les prochaines années. J'aimerais aussi rester impliqué d'une manière ou d'une autre dans la mise à disposition gratuite pour tous de livres sur l'internet, que ceci fasse partie intégrante de mon activité professionnelle ou que ceci soit une activité bénévole menée sur mon temps libre."

John Mark Ockerbloom obtient son doctorat en informatique en 1998. En 1999, il rejoint le département des bibliothèques et de l'informatique de l'Université de Pennsylvanie, où il travaille à la R&D (recherche et développement) de la bibliothèque numérique. A la même époque, il transfère The On-Line Books Page dans cette bibliothèque numérique. La présentation est toujours la même et les mises à jour sont régulières.

11.1.3. La Bibliothèque électronique de Lisieux

La Bibliothèque électronique de Lisieux ouvre en juin 1996. "Ce site est entièrement consacré et exclusivement réservé à la mise à disposition sur le réseau (librement et gratuitement) de textes littéraires et documentaires du domaine public français afin de constituer une bibliothèque virtuelle qui complète celles déjà existantes", explique Olivier Bogros, son créateur, qui est aussi directeur de la bibliothèque municipale de Lisieux (Normandie). Dès sa création, ce site pionnier suscite beaucoup d'intérêt dans la communauté francophone parce qu'il montre ce qui est faisable sur le web avec beaucoup de détermination et des moyens limités. D'abord hébergé sur les pages du compte CompuServe d'Olivier Bogros, il est depuis juin 1998 installé sur un nouveau serveur avec un espace disque plus important (30 Mo) et un nom de domaine.

Quel est l'historique du site? La première étape est la "création d'un bulletin électronique d'informations bibliographiques locales (Les Affiches de Lisieux) en 1994 dont la diffusion locale ne rencontre qu'un très faible écho", raconte Olivier Bogros lors d'un premier entretien. Les étapes suivantes sont "en 1995 la numérisation de nos collections de cartes postales en vue de constituer une photothèque numérique" puis "la saisie de nouvelles d'auteurs d'origine normande courant 1995 en imitation (modeste) du projet de l'ABU (Association des bibliophiles universels) avec diffusion sur un BBS (bulletin board service) spécialisé. L'idée du site internet vient d'Hervé Le Crosnier, enseignant à l'Université de Caen et modérateur de la liste de diffusion Biblio-fr, qui monta sur le serveur de l'université la maquette d'un site possible pour la bibliothèque municipale de Lisieux, afin que je puisse en faire la démonstration à mes élus. La suite logique en a été le vote au budget primitif de 1996 d'un crédit pour l'ouverture d'une petite salle multimédia avec accès public au réseau pour les Lexoviens (habitants de Lisieux, ndlr). Depuis cette date, un crédit d'entretien pour la mise à niveau des matériels informatiques est alloué au budget de la bibliothèque qui permettra cette année (deuxième semestre 1998, ndlr) la montée en puissance des machines, l'achat d'un graveur de cédéroms et la mise à disposition d'une machine bureautique pour les lecteurs de l'établissement.... ainsi que la création d'un emploi jeune pour le développement des nouvelles technologies."

En juillet 1999, Olivier Bogros relate: "Nous réfléchissons, toujours dans le domaine patrimonial, à un prolongement du site actuel vers les arts du livre - illustration, typographie... - toujours à partir de notre fonds. Sinon, pour ce qui est des textes, nous allons vers un élargissement de la part réservée au fonds normand. (...) Les oeuvres à diffuser sont choisies à partir d'exemplaires conservés à la bibliothèque municipale de Lisieux ou dans des collections particulières mises à disposition. Les textes sont saisis au clavier et relus par du personnel de la bibliothèque, puis mis en ligne après encodage (370 oeuvres sont actuellement disponibles en ligne). La mise à jour est mensuelle (3 à 6 textes nouveaux). Par goût, mais aussi contraints par le mode de production, nous sélectionnons plutôt des textes courts (nouvelles, brochures, tirés à part de revues, articles de journaux...). De même nous laissons à d'autres (bibliothèques ou éditeurs) le soin de mettre en ligne les grands classiques de la littérature française, préférant consacrer le peu de temps et de moyens dont nous disposons à mettre en ligne des textes excentriques et improbables. (...) La création et la maintenance du site ne sont encore que des activités marginales de la bibliothèque municipale (...) En fait, et pour les deux années à venir, l'essentiel de notre temps est consacré à la mise en place de la nouvelle médiathèque (avec une réelle intégration des nouvelles technologies) [et pour le quotidien] à l'enrichissement et la communication sur place des ressources locales (c'est-à-dire des informations physiquement localisées à la bibliothèque), le développement de la lecture dans les quartiers... La salle multimédia ouverte en octobre 1996 doit encore trouver son rythme de croisière, la consultation des cédéroms et la bureautique devançant souvent l'utilisation d'internet."

En août 2000, Olivier Bogros écrit: "La médiathèque n'ouvrira ses portes qu'en janvier 2002 et ce chantier va encore mobiliser l'essentiel de mon temps. Nous poursuivons modestement l'enrichissement du corpus de textes de la bibliothèque électronique. Une collaboration vient de s'engager entre la bibliothèque électronique de Lisieux et le site 'Langue du 19e siècle" à l'Université de Toronto. Les textes en ligne à Lisieux sont interrogeables en ligne à Toronto sous forme de bases de données interactives. L'initiative de ce projet, baptisé LexoTor, revient à M. Russon Wooldridge à la suite d'un colloque organisé en mai dernier par son université."

Lancé officiellement le 27 août 2000, LexoTor est une base de données qui fonctionne sous le logiciel TACTweb et qui permet l'interrogation en ligne des textes de la bibliothèque classés en différentes rubriques: oeuvres littéraires, notamment du 19e siècle; brochures et opuscules documentaires ; manuscrits, livres et brochures sur la Normandie; conférences et exposés transcrits par des élèves du Lycée Marcel Gambier. L'interrogation permet aussi les analyses et comparaisons textuelles. Le projet est issu de la rencontre d'Olivier Bogros avec Russon Wooldridge, professeur au département d'études françaises de l'Université de Toronto, lors d'un colloque international que ce dernier a organisé les 12 et 13 mai 2000 dans son université sur le thème: "Les études françaises valorisées par les nouvelles technologies d'information et de communication".

En mai 2001, Olivier Bogros poursuit: "La base Lexotor devrait pouvoir bénéficier dès ce mois-ci de la dernière version du logiciel TACTweb, ce qui rendra beaucoup plus riches et pertinentes les interrogations faites. Pour ce qui concerne Lisieux, le bâtiment de la médiathèque est sorti de terre, le gros oeuvre sera fini fin juin, la livraison est prévue pour novembre. Par contre l'ouverture initialement prévue pour janvier 2002 sera sans doute effective fin mars. Sur le site de la bibliothèque électronique, le travail se poursuit chaque mois avec la mise en ligne de textes. J'ai suspendu provisoirement la fabrication de hiboux (e-books, ndlr) au format Microsoft Reader ou Mobipocket. Il faudrait que je trouve un partenariat avec un autre site pour que les textes disponibles en HTML sur notre bibliothèque électronique soient aussi proposés ailleurs dans un format hiboux multiplateforme. A titre personnel, j'ai ouvert une autre bibliothèque électronique, Miscellanées, encore en devenir."

11.1.4. La médiathèque de l'Institut Pasteur

Basé à Paris et dans plusieurs régions du monde, l'Institut Pasteur est une fondation privée dont la mission est de contribuer à la prévention et au traitement des maladies, en priorité infectieuses, par la recherche, l'enseignement, et des actions de santé publique.

"Le site web de la bibliothèque a pour vocation principale de servir la communauté pasteurienne, explique Bruno Didier, son webmestre. Il est le support d'applications devenues indispensables à la fonction documentaire dans un organisme de cette taille: bases de données bibliographiques, catalogue, commande de documents et bien entendu accès à des périodiques en ligne (un peu plus d'une centaine actuellement). C'est également une vitrine pour nos différents services, en interne mais aussi dans toute la France et à l'étranger. Il tient notamment une place importante dans la coopération documentaire avec les instituts du réseau Pasteur à travers le monde. Enfin j'essaie d'en faire une passerelle adaptée à nos besoins pour la découverte et l'utilisation d'internet. Il existe dans sa forme actuelle depuis 1996 et son audience augmente régulièrement."

En quoi consiste exactement son activité? "Je développe et maintiens les pages du serveur, ce qui s'accompagne d'une activité de veille régulière. Par ailleurs je suis responsable de la formation des usagers, ce qui se ressent dans mes pages. Le web est un excellent support pour la formation, et la plupart des réflexions actuelles sur la formation des usagers intègrent cet outil. C'est à la fois dans nos rapports avec l'information et avec les usagers que les changements ont eu lieu. Nous devenons de plus en plus des médiateurs, et peut-être un peu moins des conservateurs. Mon activité actuelle est typique de cette nouvelle situation: d'une part dégager des chemins d'accès rapides à l'information et mettre en place des moyens de communication efficaces, d'autre part former les utilisateurs à ces nouveaux outils. Je crois que l'avenir de notre métier passe par la coopération et l'exploitation des ressources communes. C'est un vieux projet certainement, mais finalement c'est la première fois qu'on dispose enfin des moyens de le mettre en place."

11.1.5. Le centre de documentation de l'Organisation de coopération et de développement économiques (OCDE)

L'OCDE (Organisation de coopération et de développement économiques) regroupe trente pays membres "au sein d'une organisation qui, avant tout, offre aux gouvernements un cadre pour examiner, élaborer et perfectionner les politiques économiques et sociales", lit-on sur le site web de l'organisation. "Ils y comparent leurs expériences respectives, s'y efforcent d'apporter des réponses aux problèmes qui leur sont communs et s'y emploient à coordonner des politiques intérieures et internationales qui, dans le contexte actuel de mondialisation des économies, doivent former un ensemble de plus en plus homogène. (...) L'OCDE est un club de pays qui partagent les mêmes idées. C'est un club de riches en ce sens que ses membres produisent les deux tiers des biens et services du monde, mais ce n'est pas un club privé. En fait, l'exigence essentielle pour en devenir membre est qu'un pays soit attaché aux principes de l'économie de marché et de la démocratie pluraliste. Au noyau d'origine, constitué de pays d'Europe et d'Amérique du Nord, sont venus s'ajouter le Japon, l'Australie, la Nouvelle-Zélande, la Finlande, le Mexique, la République tchèque, la Hongrie, la Pologne et la Corée. De plus, l'OCDE a établi de nombreux contacts avec le reste du monde dans le cadre de programmes avec des pays de l'ancien bloc soviétique, d'Asie et d'Amérique latine, contacts qui pourraient, dans certains cas, déboucher sur une adhésion."

Situé dans un des bâtiments de son siège parisien et réservé aux agents de l'OCDE, le centre de documentation et d'information (CDI) permet la consultation de 60.000 monographies imprimées et 2.500 périodiques. Le CDI fournit aussi nombre de documents électroniques émanant du web, de bases de données et de CD-Rom. Peter Raggett, son directeur, a d'abord été en poste dans les bibliothèques gouvernementales du Royaume-Uni avant de devenir fonctionnaire international à l'OCDE en 1994, comme sous-directeur puis directeur du CDI. Il utilise l'internet depuis 1996. Les pages intranet du CDI, dont il est l'auteur, sont devenues une des principales sources d'information du personnel de l'organisation.

"Je dois filter l'information pour les usagers de la bibliothèque, ce qui signifie que je dois bien connaître les sites et les liens qu'ils proposent, explique Peter Raggett en juin 1998. J'ai sélectionné plusieurs centaines de sites pour en favoriser l'accès à partir de l'intranet de l'OCDE, et cette sélection fait partie du bureau de référence virtuel proposé par la bibliothèque à l'ensemble du personnel. Outre les liens, ce bureau de référence contient des pages de références aux articles, monographies et sites web correspondant aux différents projets de recherche en cours à l'OCDE, l'accès en réseau aux CD-Rom, et une liste mensuelle des nouveaux titres." En août 1999, il relate: "Notre site intranet va être complètement remanié d'ici la fin de l'année, et nous allons y mettre le catalogue de la bibliothèque, ce qui permettra à nos usagers d'y avoir accès directement de leur écran. Ce catalogue sera conforme à la norme Z3950 (une norme définissant un protocole pour la recherche documentaire d'un ordinateur à un autre, ndlr)." Depuis octobre 1999, le catalogue du CDI est disponible sur l'intranet.

Comment Peter Raggett voit-il l'avenir de la profession? "L'internet offre aux chercheurs un stock d'informations considérable. Le problème pour eux est de trouver ce qu'ils cherchent. Jamais auparavant on n'avait senti une telle surcharge d'informations, comme on la sent maintenant quand on tente de trouver un renseignement sur un sujet précis en utilisant les moteurs de recherche disponibles sur l'internet. A mon avis, les bibliothécaires auraient un rôle important à jouer pour améliorer la recherche et l'organisation de l'information sur l'internet. Je prévois aussi une forte expansion de l'internet pour l'enseignement et la recherche. Les bibliothèques seront amenées à créer des bibliothèques numériques permettant à un étudiant de suivre un cours proposé par une institution à l'autre bout du monde. La tâche du bibliothécaire sera de filtrer les informations pour le public. Personnellement, je me vois devenir de plus en plus un bibliothécaire virtuel. Je n'aurai pas l'occasion de rencontrer les usagers, ils me contacteront plutôt par courrier électronique, par téléphone ou par fax, j'effectuerai la recherche et je leur enverrai les résultats par voie électronique."

11.1.6. Le centre de documentation de l'Institut d'études politiques (IEP) de Grenoble

Pierre Le Loarer est directeur du centre de documentation de l'Institut d'études politiques (IEP) de Grenoble. Conçu dès février 1998, le site web de l'IEP ouvre trois mois après, en mai. "J'étais le chef de projet, explique Pierre Le Loarer, d'autant que j'ai une formation multimédia, outre ma formation initiale en philosophie, documentation-bibliothèques et informatique. Il y avait un comité de pilotage (au sein de notre Institut) et également plusieurs partenaires: un graphiste (qui venait de créer le logo de l'Institut) à qui j'ai demandé de décliner des éléments cohérents pour le site, en liaison avec la société de multimédia; une société de création multimédia à qui j'ai demandé de créer une 'maquette' de page d'accueil et deux modèles de pages (page de rubrique principale, page de sous-rubrique) pour disposer d'une ligne graphique; une ergonome qui avait pour objet de tester et surtout de faire tester la version 1 (maquette) du site, pour ensuite réaliser une version 2 opérationnelle, ce qui a été fait; une rédactrice qui, avec moi-même, a repris, sélectionné les informations et même partiellement réécrit certains textes et surtout organisé avec moi les rubriques et sous-rubriques, créé les libellés d'intitulés, etc., ce travail étant soumis au comité de pilotage; le CRI (centre de recherche en informatique) de l'université pour réaliser les pages HTML en suivant les modèles, une fois validés, des pages de différents niveaux et également pour héberger le site. Dans un second temps, un professeur d'anglais m' a aidé à créer quelques pages en anglais. Aujourd'hui, le site est maintenu à jour par moi-même et une personne qui m'aide grandement pour cette tâche."

En quoi consiste exactement l'activité de Pierre Le Loarer? "Elle est très variée. Je ne reviens pas sur mes fonctions de directeur d'un centre de documentation, sinon pour insister sur deux facteurs: l'importance de la formation des étudiants à la recherche documentaire, à la connaissance des sources d'information, imprimées et électroniques, et à la production de documents sous forme numérique; la conception, que je reprends à mon compte, de la 'bibliothèque hybride' qui gère, donne accès à la fois aux documents imprimés et aux documents électroniques. Il me semble que l'on peut même parler de 'lecture hybride' où l'on passe de l'écran à divers supports imprimés et l'inverse.

Mes fonctions de chargé de mission TICE (technologies de l'information et de la communication pour l'éducation) visent à mettre ces TICE au service de la stratégie de l'Institut, pour son développement, pour renforcer encore la qualité de son enseignement, faciliter des accompagnements pédagogiques, aider au développement des relations internationales grâce aux facilités de l'échange électronique. Les TICE ne sont pas un but en soi, mais bien un outil au service d'objectifs stratégiques. Ceci passe, entre autres, par la création d'intranets pédagogiques, un renforcement de la formation en bureautique communicante pour les étudiants, les enseignants et le personnel administratif.

Quant à mon activité internet, elle a divers aspects, qui sont assez différents: gestionnaire de site, formateur pour un usage à la fois réfléchi et professionnel du web, animateur, participant à des séminaires, réunions diverses sur l'internet (et l'éducation, les collectivités territoriales, etc.). Membre de l'ISOC (Internet Society), je participe aux rencontres d'Autrans."

11.1.7. La bibliothèque de l'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée) d'Abidjan

L'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée) d'Abidjan assure la formation des statisticiens pour les pays africains d'expression française. Cette formation est délivrée à travers quatre filières distinctes, conçues en fonction du niveau de recrutement des élèves: la filière ISE (ingénieurs statisticiens économistes), la filière ITS (ingénieurs des travaux statistiques), la filière AD (adjoints techniques) et la filière AT (agents techniques). A ce jour, l'ENSEA est le seul établissement de formation statistique qui délivre simultanément ces quatre types de formation à tous les pays francophones situés au sud du Sahara. L'ENSEA propose par ailleurs des actions de recyclage et de perfectionnement destinées aux cadres des administrations publiques et privées, et développe progressivement des programmes d'étude et de recherche.

"Le site a été créé à la faveur d'un colloque international sur les enquêtes et systèmes d'information organisé par l'école en avril 1999, explique Bakayoko Bourahima, documentaliste. La conception et la maintenance du site ont été assurées par un coopérant français, enseignant d'informatique. Le site est actuellement hébergé par l'agence locale du Syfed (du réseau Refer de l'AUPELF-UREF - Agence universitaire de la francophonie). Le site a connu quelques difficultés de mise à jour, en raison des nombreuses occupations pédagogiques et techniques du webmestre. A ce propos, mon service, celui de la bibliothèque, a eu récemment des séances de travail avec l'équipe informatique pour discuter de l'implication de la bibliothèque dans l'animation du site. Et le service de la bibliothèque travaille aussi à deux projets d'intégration du web pour améliorer ses prestations."

Bakayoko Bourahima est responsable du service de la bibliothèque. "Je m'occupe de la gestion de l'information scientifique et technique et de la diffusion des travaux publiés par l'école, écrit-il. (...) J'espère bientôt pouvoir mettre à la disposition de mes usagers un accès internet pour l'interrogation de bases de données. Par ailleurs, j'ai en projet de réaliser et de mettre sur l'intranet et sur le web un certain nombre de services documentaires (base de données thématique, informations bibliographiques, service de références bibliographiques, bulletin analytique des meilleurs travaux d'étudiants...) Il s'agit donc pour la bibliothèque, si j'obtiens les financements nécessaires pour ces projets, d'utiliser pleinement l'internet pour donner à notre école une plus grand rayonnement et de renforcer sa plate-forme de communication avec tous les partenaires possibles. En intégrant cet outil au plan de développement de la bibliothèque, j'espère améliorer la qualité et élargir la gamme de l'information scientifique et technique mise à la disposition des étudiants, des enseignants et des chercheurs, tout en étendant considérablement l'offre des services de la bibliothèque."

11.1.8. L'association Juriconnexion (documentation juridique)

Emmanuel Barthe est documentaliste juridique et responsable informatique chez Coutrelis & Associés, un cabinet d'avocats. "Les principaux domaines de travail du cabinet sont le droit communautaire, le droit de l'alimentation, le droit de la concurrence et le droit douanier, explique-t-il. Je fais de la saisie indexation, et je conçois et gère les bases de données internes. Pour des recherches documentaires difficiles, je les fais moi-même ou bien je conseille le juriste. Je suis aussi responsable informatique et télécoms du Cabinet: conseils pour les achats, assistance et formation des utilisateurs. De plus, j'assure la veille, la sélection et le catalogage de sites web juridiques: titre, auteur et bref descriptif. Je suis également formateur internet juridique aussi bien à l'intérieur de mon entreprise qu'à l'extérieur lors de stages de formation. Auparavant, j'ai été responsable pendant cinq ans de la documentation du cabinet d'avocat Stibbe Simont Monahan Duhot & Giroux, dont j'ai mis en place les structures et les collections. J'ai également effectué une mission de six mois chez Korn/Ferry International, un important cabinet de recrutement, à l'occasion de sa fusion avec Vuchot & Associés. J'ai alors travaillé sur l'installation du nouveau système informatique et la fusion des bases de candidats gérées par les deux cabinets.

Membre du conseil d'administration de Juriconnexion, je m'y suis spécialisé dans les CD-Rom puis l'internet juridique. Depuis l'automne 1999, je m'occupe de modérer et d'animer la liste de discussion Juriconnexion. L'association Juriconnexion a pour but la promotion de l'électronique juridique, c'est à dire la documentation juridique sur support électronique et la diffusion des données publiques juridiques. Elle organise des rencontres entre les utilisateurs et les éditeurs juridiques et de bases de données, ainsi qu'une journée annuelle sur un thème. Celle du 23 novembre 2000 portait sur les sites juridiques francophones. Vis-à-vis des autorités publiques, Juriconnexion a un rôle de médiateur et de lobbying à la fois. L'association, notamment, est favorable à la diffusion gratuite sur internet des données juridiques produites par le Journal officiel et les tribunaux. Les bibliothécaires-documentalistes juridiques représentent la majorité des membres de l'association, suivis par certains représentants des éditeurs et des juristes. Juriconnexion a créé la liste de discussion du même nom, qui traite des mêmes sujets mais reste ouverte aux non-membres." En mai 2001, l'association approche les 400 membres.

11.1.9. La médiathèque de l'Institut français de Londres

L'Institut français de Londres est un organisme officiel français destiné à faire connaître la langue et la culture françaises dans la capitale britannique. 5.000 étudiants environ suivent les cours de langue chaque année, ce qui fait de cet institut l'un des plus importants instituts français au monde. Le centre culturel inclut une bibliothèque multimédia, un cinéma, une salle de conférence et un restaurant.

Anissa Rachef est bibliothécaire dans cet organisme. "Je suis chargée du catalogage du fonds documentaire qui est constitué de livres, de vidéos, de disques compacts et de disques optiques ainsi que de périodiques, écrit-elle. Avant mon installation à Londres, soit de 1980 à 1983, j'ai travaillé à la bibliothèque universitaire d'Alger en qualité d'attachée de recherche. C'est d'Alger et en deux ans que j'ai préparé le DSB (diplôme supérieur des bibliothèques), diplôme de conservateur assimilé à celui de l'ENSB de Lyon (Ecole nationale supérieure des bibliothèques, devenue ensuite l'ENSSIB - Ecole nationale supérieure des sciences de l'information et des bibliothèques, ndlr). Recrutée selon un statut local depuis septembre 1987 à l'Institut français de Londres, j'y exerce le métier de bibliothécaire au sein d'une équipe de huit membres. Par ailleurs, titulaire d'un diplôme de FLE (français langue étrangère), j'assure des heures d'enseignement de français dans le même institut.

La médiathèque de l'Institut français de Londres fut inaugurée en mai 1996. L'objectif est double: servir un public s'intéressant à la culture et la langue françaises et 'recruter' un public allophone en mettant à disposition des produits d'appel tels que vidéos documentaires, livres audio, CD-Rom. La mise en place récente d'un espace multimédia sert aussi à fidéliser les usagers. L'installation d'un service d'information rapide a pour fonction de répondre dans un temps minimum à toutes sortes de questions posées via courrier électronique, ou par fax. Ce service exploite les nouvelles technologies pour des recherches très spécialisées. Nous élaborons également des dossiers de presse destinés aux étudiants et professeurs préparant des examens de niveau secondaire. Je m'occupe essentiellement de catalogage, d'indexation et de cotation. Je suis chargée également du service de prêt inter-bibliothèques. J'anime des ateliers in situ de catalogage UNIMARC (MARC: machine readable catalogue) ainsi que des ateliers d'indexation RAMEAU (répertoire d'autorités matières encyclopédique et alphabétique unifié). J'élabore ponctuellement des aménagements de vedettes matières propres à notre catalogue. J'utilise internet pour des besoins de base. Recherches bibliographiques, commande de livres, courrier professionnel, prêt inter-bibliothèques. C'est grâce à internet que la consultation de catalogues collectifs, tels SUDOC (Système universitaire de documentation) et OCLC (Online Computer Library Center), a été possible. C'est ainsi que que j'ai pu mettre en place un service de fourniture de documents extérieurs à la médiathèque. Des ouvrages peuvent désormais être acheminés vers la médiathèque pour des usagers ou bien à destination des bibliothèques anglaises."


11.2. Numérisation en mode texte et en mode image

La numérisation du document imprimé, c'est-à-dire sa conversion sous une forme chiffrée binaire, peut être effectuée soit en mode texte, soit en mode image.

La numérisation en mode texte consiste à scanner le livre puis à contrôler le résultat à l'écran en relisant le tout. Les documents originaux manquant de clarté - certains livres anciens par exemple - sont saisis ligne après ligne. Ce mode de numérisation est long, et la notion de livre ou de page n'est pas conservée, puisque le texte apparaît en continu à l'écran. Cette méthode est nettement plus coûteuse que la numérisation en mode image, mais très préférable, puisqu'elle permet la recherche textuelle, l'indexation, les recherches séquentielles, les analyses, les comparaisons, etc. C'est la méthode utilisée par le Projet Gutenberg (11.1.1), la Bibliothèque électronique de Lisieux (11.1.3), et bien d'autres.

La numérisation en mode image correspond à la "photographie" du livre page après page. La notion de livre est conservée. La version informatique est en quelque sorte le fac-similé de la version imprimée. On peut donc "feuilleter" le texte page après page sur l'écran. C'est la méthode employée pour les numérisations à grande échelle, par exemple pour la constitution de Gallica, bibliothèque numérique de la Bibliothèque nationale de France (BnF). Même si, pour des raisons de coût, la BnF a choisi la numérisation en mode image, elle utilise le mode texte pour les tables des matières, les sommaires et les légendes des corpus iconographiques, afin de faciliter la recherche plein-texte. Pourquoi ne pas tout numériser en mode texte ? La BnF répond sur le site de Gallica: "Le mode image conserve l'aspect initial de l'original y compris ses éléments non textuels. Si le mode texte autorise des recherches riches et précises dans un document et permet une réduction significatice du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR (optical character recognition), implique des coûts de traitement environ 10 fois supérieurs à la simple numérisation. Ces techniques parfaitement envisageables pour des volumes limités ne pouvaient ici être économiquement justifiables au vu des 35.000 documents (représentant presque 15 millions de pages) mis en ligne."

Selon Pierre Schweitzer, l'architecte designer qui a conçu @folio, support numérique de lecture nomade, "le mode image permet d'avancer vite et à très faible coût. C'est important car la tâche de numérisation du domaine public est immense. Il faut tenir compte aussi des différentes éditions: la numérisation du patrimoine a pour but de faciliter l'accès aux oeuvres, il serait paradoxal qu'elle aboutisse à focaliser sur une édition et à abandonner l'accès aux autres. Chacun des deux modes de numérisation s'applique de préférence à un type de document, ancien et fragile ou plus récent, libre de droit ou non (pour l'auteur ou pour l'édition), abondamment illustré ou pas. Les deux modes ont aussi des statuts assez différents: en mode texte ça peut être une nouvelle édition d'une oeuvre, en mode image c'est une sorte d''édition d'édition', grâce à un de ses exemplaires (qui fonctionne alors comme une fonte d'imprimerie pour du papier: une trace optique sur un support, numérique, c'est assez joli à réaliser). En pratique, le choix dépend bien sûr de la nature du fonds à numériser, des moyens et des buts à atteindre. Difficile de se passer d'une des deux façons de faire."

L'équipe d'@folio travaille notamment sur le logiciel Mot@Mot, une passerelle entre @folio (voir 8.1) et les fonds numérisés en mode image. "La plus grande partie du patrimoine écrit existant est fixé dans des livres, sur du papier, explique Pierre Schweitzer. Pour rendre ces oeuvres accessibles sur la toile, la numérisation en mode image est un moyen très efficace. Le projet Gallica en est la preuve. Mais il reste le problème de l'adaptation des fac-similés d'origine à nos écrans de lecture aujourd'hui: réduits brutalement à la taille d'un écran, les fac-similés deviennent illisibles. Sauf à manipuler les barres d'ascenseur, ce qui nécessite un ordinateur et ne permet pas une lecture confortable. La solution proposée par Mot@mot consiste à découper le livre, mot à mot, du début à la fin (enfin, les pages scannées du livre...). Ces mots restent donc des images, il n'y a pas de reconnaissance de caractères, donc pas d'erreur possible. On obtient une chaîne d'images-mots liquide, qu'on peut remettre en page aussi facilement qu'une chaîne de caractères. Il devient alors possible de l'adapter à un écran de taille modeste, sans rien perdre de la lisibilité du texte. La typographie d'origine est conservée, les illustrations aussi."


11.3. Les bibliothèques traditionnelles sont-elles menacées?

Face à un web encyclopédique et des bibliothèques numériques de plus en plus nombreuses, les jours des bibliothèques traditionnelles sont-ils comptés? Ou bien, au contraire, l'internet joue-t-il un rôle de catalyseur pour les relancer?

En fait, il n'est peut-être pas très opportun d'opposer bibliothèque traditionnelle et bibliothèque numérique. Nombre de bibliothèques numériques sont créées par des bibliothèques traditionnelles à partir de leurs propres fonds. Grâce à quoi la consultation de ces fonds devient facile. Ce qui n'était pas le cas jusque-là, pour des raisons diverses: souci de conservation des documents rares et fragiles, heures d'ouverture réduites, nombreux formulaires à remplir, longs délais de communication, pénurie de personnel. Autant de barrières à franchir qui demandaient souvent au lecteur une patience à toute épreuve et une détermination hors du commun pour arriver jusqu'au document. A présent, si on tient absolument à consulter l'original, on le fait en connaissance de cause, après avoir "feuilleté" le fac-similé numérique sur le web.

Autre élément à prendre en compte, la bibliothèque numérique peut enfin rendre comptatibles deux objectifs qui ne l'étaient guère, à savoir la conservation des documents et leur prêt. Dorénavant le document ne quitte son rayonnage qu'une seule fois pour être scanné, et le grand public y a facilement accès.

Un exemple parmi d'autres: depuis décembre 2000, le site web de la Bibliothèque municipale de Lyon donne accès à la plus importante collection française d'enluminures médiévales, à savoir 12.000 images scannées dans 457 documents appartenant à la bibliothèque: manuscrits allant du 5e au 16e siècle, incunables ou livres de la Renaissance. Les documents sont à dominante religieuse (bibles, missels, bréviaires, pontificaux, livres d'heures, droit canon) ou profane (philosophie, histoire, littérature, sciences, etc.). Les images qui ont été numérisées - plusieurs centaines pour certains documents - sont les peintures en pleine page et les miniatures, ainsi que les initiales ornées et les décors des marges.

Autre exemple significatif, depuis novembre 2000, la version numérique de la Bible de Gutenberg, premier ouvrage à avoir jamais été imprimé, est en accès libre sur le site de la British Library. Cette Bible date de 1454-1455, et elle aurait été imprimée par Gutenberg en 180 exemplaires dans son atelier de Mayence (Allemagne). 48 exemplaires, dont certains incomplets, existeraient toujours. La British Library en possède deux versions complètes, et une partielle. En mars 2000, dix chercheurs et experts techniques de l'Université Keio de Tokyo et de NTT (Nippon Telegraph and Telephone Communications) sont venus travailler sur place pendant deux semaines pour numériser ces deux Bibles, légèrement différentes, à l'aide de matériels hautement sophistiqués.

La bibliothèque numérique menace-t-elle pour autant la bibliothèque traditionnelle? Il y a quelques années, sur leur site web, alors que l'internet en était encore à ses débuts, plusieurs grandes bibliothèques insistaient sur la nécessité de garder son importance à la communication physique des imprimés, manuscrits, partitions musicales, bandes sonores, etc., tout en affirmant avoir conscience de la nécessité du développement parallèle des documents numériques. Ce type de commentaires a disparu. Les rôles respectifs des bibliothèques traditionnelles et des bibliothèques numériques semblent assez clairs maintenant.

Les bibliothèques nationales et autres grandes bibliothèques de conservation ont pour mission de préserver un patrimoine pluricentenaire - manuscrits, incunables, livres imprimés, collections de journaux, partitions musicales, gravures, images, photos, films, documents électroniques, etc. - accumulé au fil des siècles grâce au dépôt légal. Si le fait de disposer de supports numériques favorise à la fois la conservation et la communication, il faut bien un endroit pour stocker les documents physiques originaux, à commencer par les Bibles de Gutenberg.

Les bibliothèques publiques ne semblent pas près de disparaître non plus. A l'heure actuelle, malgré l'engouement suscité par le livre électronique, pratiquement personne n'est prêt à lire Zola ou Proust à l'écran. Mais c'est peut-être une question de génération. Et la mise sur le marché d'un livre électronique bon marché, suivi du papier électronique dans quelques années, risque de changer bien des choses.

Pour les bibliothèques spécialisées, par contre, le changement est nettement plus radical. Dans nombre de domaines où l'information la plus récente est primordiale, on s'interroge maintenant sur l'utilité d'aligner des documents imprimés sur des rayonnages, alors qu'il est tellement plus pratique de rassembler, stocker, archiver, organiser, cataloguer et diffuser des documents électroniques, et de les imprimer seulement à la demande.

L'avenir sera-t-il les bases de données numériques décrites dans les dernières pages de Chaos et cyberculture (éditions du Lézard, 1997) de Timothy Leary, philosophe et visionnaire? "Toute l'information du monde est à l'intérieur. Et grâce au cyberespace, tout le monde peut y avoir accès. Tous les signaux humains contenus jusque-là dans les livres ont été numérisés. Ils sont enregistrés et disponibles dans ces banques de données, sans compter tous les tableaux, tous les films, toutes les émissions de télé, tout, absolument tout." Reste à savoir si la consultation sera gratuite ou payante.


Chapitre 12: Apprendre
Table des matières


Page d'accueil du Livre 010101
Page d'accueil du NEF


© 2001 Marie Lebert