NEF - Le Livre 010101 de Marie Lebert - De l'imprimé à Internet

De l'imprimé à Internet (1999)
7. Les cyberbibliothèques

Appelées aussi bibliothèques numériques, bibliothèques électroniques ou bibliothèques virtuelles, bien qu'elles soient bien réelles quoique sur écran, les cyberbibliothèques sont peut-être l'apport majeur d'Internet dans le domaine de l'imprimé.

Grâce à Internet, des centaines d'oeuvres du domaine public, documents littéraires et scientifiques, articles, travaux universitaires et de recherche, images et bandes sonores sont maintenant disponibles à l'écran, et le mouvement va en s'amplifiant.

Après avoir tenté de définir la cyberbibliothèque, on décrira quelques cyberbibliothèques francophones et non francophones. On prendra aussi comme exemple la toile littéraire francophone sur le Web, et on examinera ensuite le futur des cyberbibliothèques.

7.1. Définition de la cyberbibliothèque
7.2. Cyberbibliothèques francophones
7.3. Cyberbibliothèques non francophones
7.4. Un exemple: la toile littéraire francophone
7.5. L'avenir des cyberbibliothèques


7.1. Définition de la cyberbibliothèque

Bibliothèque pionnière en Europe dans sa réflexion sur la cyberbibliothèque, la British Library la définit comme une entité résultant de l'utilisation des technologies numériques pour acquérir, stocker, préserver et diffuser des documents. Ces documents sont soit publiés directement sous forme numérique, soit numérisés à partir d'un document imprimé, audiovisuel ou autre.

Une collection numérique devient une bibliothèque numérique quand elle répond aux quatre facteurs suivants: 1) elle peut être créée et produite dans un certain nombre d'endroits différents, mais elle est accessible en tant qu'entité unique, 2) elle doit être organisée et indexée pour un accès aussi facile que possible à partir du lieu de base où elle est produite, 3) elle doit être stockée et gérée de manière à avoir une existence assez longue après sa création, 4) elle doit trouver un équilibre entre le respect du droit d'auteur et les exigences universitaires.

Dans Information Systems Strategy, un document qui était présent sur le site de la British Library en 1997, Brian Lang expliquait que la cyberbibliothèque ne devait pas être envisagée comme un secteur à part, mais qu'elle devait au contraire faire partie intégrante d'une vision globale de la bibliothèque. Alors que certains pensent que les documents numériques prédomineront dans les bibliothèques du futur et que d'autres sont au contraire convaincus que leur impact sera faible, la British Library n'envisage pas une bibliothèque exclusivement numérique. Elle considère comme fondamentale la communication physique des imprimés, manuscrits, partitions musicales, bandes sonores, etc., tout en ayant conscience de la nécessité du développement parallèle des documents numériques.

Cyberbibliothèque hébergée par l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, USA) et reliée au catalogue expérimental (Experimental Search System - ESS) de la Library of Congress , l'Universal Library définit les trois avantages de la bibliothèque numérique: 1) elle occupe moins de place qu'une bibliothèque réelle et son contenu peut être copié ou sauvegardé électroniquement, 2) elle est immédiatement accessible à quiconque sur Internet, 3) comme toute recherche sur son contenu peut être automatisée, elle permet une réduction des coûts importante et le développement sensible de l'accessibilité des documents.

Qui dit cyberbibliothèque dit numérisation, c'est-à-dire conversion des textes et des images en bits et en octets pour traitement informatique. Pour pouvoir être consulté à l'écran, un livre peut être numérisé en mode image ou en mode texte. La numérisation en mode image correspond à la photographie du livre page après page, pour un coût approximatif de 3 FF par page. C'est la méthode employée pour les numérisations à grande échelle, par exemple pour la plus grande partie du programme de numérisation de la Bibliothèque nationale de France. Outre un coût peu élevé, l'avantage qu'y voient les bibliothèques est la conservation de la notion de livre, puisque la version informatique est en quelque sorte le fac-similé de la version imprimée.

Les documents sont également patiemment dactylographiés page après page - par exemple ceux d'ABU: la bibliothèque universelle, de La bibliothèque électronique de Lisieux ou du Project Gutenberg. Il s'agit dans ce cas de numérisation en mode texte - puisqu'elle implique la saisie d'un texte. Contrairement à la numérisation en mode image, la version informatique ne conserve pas la notion de livre ou de page. Le livre devient texte, à savoir un ensemble de caractères standardisés qui apparaît en continu à l'écran. Cette méthode, beaucoup plus onéreuse, permet les recherches textuelles, et elle rend l'indexation du texte beaucoup plus facile. Même si, pour des raisons de coût, le texte est numérisé en mode image, la numérisation en mode texte est souvent utilisée pour les tables des matières et les sommaires. Des recherches sont actuellement menées pour que la lecture d'un texte en mode image soit également possible en mode texte.


7.2. Cyberbibliothèques francophones

Hébergée par l'Université de Genève (Suisse), Athena est l'oeuvre de Pierre Perroud. Le site bilingue français-anglais donne accès à 8.000 documents en plusieurs langues dans les domaines suivants: philosophie, sciences, période classique, littérature, histoire, économie, etc. Un de ses objectifs est de mettre des textes français à la disposition de la communauté d'Internet. La section Helvetia concerne les livres sur la Suisse. Athena propose aussi des liens avec d'autres cyberbibliothèques, ainsi qu'une table de minéralogie qui est l'oeuvre de Pierre Perroud et qui est consultée dans le monde entier.

Dans L'Hebdo, Pierre-Louis Chantre nous présente Pierre Perroud, 53 ans, professeur de philosophie au Collège Voltaire de Genève, qui consacre trente heures par semaine à Athena pour numériser des livres, mettre en page des textes envoyés par des volontaires, établir des liens électroniques avec des livres disponibles ailleurs et répondre aux centaines de lettres électroniques qu'il reçoit puisque le nombre de personnes qui consultent le site varie entre 3 mille et 18 mille par jour. Malgré ses demandes répétées au département de l'Instruction publique de Genève, celui-ci ne le paie que deux heures par semaine pour ce travail.

Ouvert en 1997, Gallica est la cyberbibliothèque de la Bibliothèque nationale de France, inaugurée avec des images et textes du 19e siècle francophone, qui fut le "siècle de l'édition et de la presse moderne, siècle du roman mais aussi des grandes synthèses historiques et philosophiques, siècle scientifique et technique". Ce serveur expérimental comprend 2.500 ouvrages numérisés en mode image complétés par 250 volumes saisis en mode texte de la base FRANTEXT du CNRS (Centre national de la recherche scientifique). Classées par discipline, ces ressources sont complétées par une chronologie du 19e siècle et des synthèses sur les grands courants en histoire, sciences politiques, droit et économie, littérature, philosophie, sciences et histoire des sciences. Le site propose aussi un échantillon de l'iconothèque numérique de la même époque, à savoir le fonds du photographe Eugène Atget, une sélection d'images sur l'écrivain Pierre Loti, une collection d'images de l'Ecole nationale des ponts et chaussées sur les grands travaux qui ont accompagné la révolution industrielle en France, et un choix de livres illustrés de la Bibliothèque du Musée de l'homme.

Le but de Gallica est de préfigurer ce que sera la consultation à distance des collections numérisées de la Bibliothèque nationale de France, qui devraient comprendre 100.000 volumes et 300.000 images fixes à la fin de 1999 et s'accroître ensuite régulièrement. Ces collections numériques pourront également être consultées sur place au moyen de 3.000 postes multimédias (dont quelques centaines fonctionnent déjà), et qui permettront à la fois d'accéder aux catalogues et de consulter les documents numériques. Les 100.000 volumes, qui représentent 30 millions de pages numérisées, ont été choisis dans les collections des imprimés, et plus du tiers concerne le 19e siècle. Quant aux 300.000 images fixes, la moitié appartient aux départements spécialisés de la BnF (Estampes et photographie, Manuscrits, Arts du spectacle, Monnaies et médailles, etc.). L'autre moitié provient de collections d'établissements publics (musées et bibliothèques, La Documentation française, l'Ecole nationale des ponts et chaussées, l'Institut Pasteur, l'Observatoire de Paris, etc.) ou privés (associations, agences de presse dont Magnum, l'Agence France-Presse, Sygma, Rapho, etc.).

Fin 1997, il était expliqué sur le site que Gallica se voulait moins une banque de données numérisées qu'un "laboratoire dont l'objet est d'évaluer les conditions d'accès et de consultation à distance des documents numériques". Le but était d'expérimenter la navigation dans ces fonds, une navigation qui permet à la fois le libre parcours du chercheur ou du curieux et des recherches textuelles très pointues.

En 1998 la Bibliothèque nationale de France a quelque peu modifié ses orientations premières. Dans Le Figaro du 3 juin 1998, Jérôme Strazzulla expliquait que la BnF était "passée d'une espérance universaliste, encyclopédique, à la nécessité de choix éditoriaux pointus". Dans cet article, Jean-Pierre Angremy, président de la BnF, expliquait le choix de son comité éditorial:

"Nous avons décidé d'abandonner l'idée d'un vaste corpus encyclopédique de cent mille livres, auquel on pourrait sans cesse reprocher des trous. Nous nous orientons aujourd'hui vers des corpus thématiques, aussi complets que possibles, mais plus restreints. [...] Nous cherchons à répondre, en priorité, aux demandes des chercheurs et des lecteurs."

Prévu pour dans deux ans, le premier corpus concerne les voyages en France, et il rassemblera des textes, estampes et photographies du 16e siècle à 1920. Les corpus envisagés ensuite sont: Paris, les voyages en Afrique des origines à 1920, les utopies, et les mémoires des Académies des sciences de province.

Fondée en avril 1993 et hébergée par le Centre d'études et de recherche informatique (CEDRIC) du Conservatoire des arts et métiers (CNAM), l'ABU: la bibliothèque universelle est la cyberbibliothèque de l'Association des bibliophiles universels. Depuis 1993, elle permet l'accès libre au texte intégral d'oeuvres du domaine public francophone soit, en chiffres, 223 textes et 76 auteurs.

Ce nom ABU vient à la fois de Aboulafia, petit ordinateur présent dans Le pendule de Foucault, roman d'Umberto Ecco dans lequel "s'entremêlent savoirs anciens et high tech", et dont l'intrigue est située au Conservatoire national des arts et métiers (CNAM), qui héberge l'ABU. "Au départ, il s'agissait de biblioFiles universels, et non de biblioPHiles; mais la préfecture de Paris n'a pas semblé saisir tout le sel de ce néologisme", explique l'ABU sur son site.

La bibliothèque électronique de Lisieux (Normandie) comprend la version intégrale d'une oeuvre littéraire du domaine public - avec une nouvelle oeuvre chaque mois - les archives des mois précédents, une sélection d'oeuvres courtes du 19e siècle, une sélection du fonds documentaire de la bibliothèque (opuscules, brochures, tirés à part), une sélection de son fonds normand (brochures et bibliographies), ainsi qu'un choix de sites normands et de sites littéraires francophones.

La sélection mensuelle de janvier 1998 était Les Déliquescences, poèmes décadents d'Adoré Floupette (1885), une oeuvre de Henri Beauclair et Gabriel Vicaire. Les mois précédents avaient vu passer des oeuvres de Théophile Gautier, Vivant Denon, Jean Lorrain, Charles Nodier, Ernest Lavisse, Jean Revel, Charles Rabou, Claire de Duras, Xavier Forneret, Ernest Renan, Joris-Karl Huysmans, Philarète Chasles, Emile Gaboriau, Georges Eekhoud, Prosper Mérimée, Stendhal, Denis Diderot, Gaston Leroux, Marc de Montifaud, etc.

Le rayon littéraire présente une collection de pages consacrées principalement aux auteurs du 19e siècle: des nouvelles de Jean Lorrain, Guy de Maupassant, Alphonse Allais, Octave Mirbeau, Remy de Gourmont, Jules Barbey d'Aurevilly, Isabelle Eberhardt, Charles Asselineau, Marcel Schwob, Jean Richepin, Eugène Mouton, Jean de La Ville de Mirmont, Léon Bloy, des lettres de Gustave Flaubert, ainsi que des bibliographies et des travaux du lycée Marcel Gambier de Lisieux. Dans le quotidien Libération du 17 avril 1998, Olivier Bogros, directeur de la bibliothèque, racontait:

"En me baladant sur un BBS [bulletin board service], j'ai vu qu'on s'échangeait des textes. Je me suis dit qu'on pouvait rassembler en local tout ce qui traînait comme textes électroniques et les mettre à disposition des lecteurs. [...] Les francophones qui ne trouvent pas un texte ou une référence à la bibliothèque de la Réunion, des Italiens qui font des études de français et cherchent tel poème de Mallarmé, un Japonais en quête d'un nom latinisé, un éditeur anglais qui cherche des documents sur les maisons en bois... On a reçu des mails du monde entier."

Quel est l'historique de ce site qui suscite beaucoup d'intérêt dans le monde francophone parce qu'il montre ce qui est faisable avec beaucoup de détermination et des moyens limités? Dans son courrier électronique du 18 juin 1998, Olivier Bogros expliquait:

"Le site La bibliothèque électronique de Lisieux a été ouvert en juin 1996. Hébergé sur les pages personnelles, limitées à 5 Mo, de mon compte CompuServe, il est depuis quelques jours [début juin 1998] installé sur un nouveau serveur où il dispose d'un espace disque plus important (15 Mo) et surtout d'un nom de domaine. Les frais inhérents à l'entretien du site sont à ma charge, la ville finance de manière indirecte le site en acceptant que tous les textes soient choisis, saisis et relus par du personnel municipal sur le temps de travail (ma secrétaire pour la saisie et une collègue pour la relecture). Ce statut étrange et original fait de La bibliothèque électronique de Lisieux le site presque officiel de la Bibliothèque municipale, tout en restant sous mon entière responsabilité, sans contrôle ni contrainte.

J'ai déjà rapporté dans un article paru dans le Bulletin des Bibliothèques de France [1997, n° 3, article en ligne] ainsi que dans le Bulletin de l'ABF [Association des bibliothécaires français] [1997, n° 174, sommaire en ligne], comment l'envie de créer une bibliothèque virtuelle avait rapidement fait son chemin depuis ma découverte de l'informatique en 1994 : création d'un bulletin électronique d'informations bibliographiques locales (Les Affiches de Lisieux) en 1994 dont la diffusion locale ne rencontre qu'un très faible écho, puis en 1995 début de la numérisation de nos collections de cartes postales en vue de constituer une photothèque numérique, saisie de nouvelles d'auteurs d'origine normande courant 1995 en imitation (modeste) du projet de l'ABU [Association des bibliophiles universels] avec diffusion sur un BBS [bulletin board service] spécialisé. L'idée du site Internet vient d'Hervé Le Crosnier, enseignant à l'université de Caen et modérateur de la liste de diffusion Biblio-fr, qui monta sur le serveur de l'université la maquette d'un site possible pour la Bibliothèque municipale de Lisieux, afin que je puisse en faire la démonstration à mes élus. La suite logique en a été le vote au budget primitif de 1996 d'un crédit pour l'ouverture d'une petite salle multimédia avec accès public au réseau pour les Lexoviens [habitants de Lisieux]. Depuis cette date un crédit d'entretien pour la mise à niveau des matériels informatiques est alloué au budget de la bibliothèque qui permettra cette année la montée en puissance des machines, l'achat d'un graveur de cédéroms et la mise à disposition d'une machine bureautique pour les lecteurs de l'établissement.... ainsi que la création en ce début d'année d'un emploi jeune pour le développement des nouvelles technologies."

Une autre initiative intéressante est celle de Bibelec (Bibliothèque électronique des étudiants), réalisée par les étudiants de Sciences-Po (Institut d'études politiques, Paris). Lors de sa création, elle se définissait comme la première cyberbibliothèque française en sciences sociales exclusivement réalisée par des étudiants.

Professeur de français, de littérature française et d'applications informatiques à Tokyo (Japon), Patrick Rebollar utilise l'ordinateur pour la recherche et l'enseignement depuis plus de dix ans. En 1994, il a vu apparaître Internet "dans le champ culturel et linguistique francophone" et il a débuté son site web en 1996. Son site comprend notamment une excellente Chronologie littéraire 1848-1914, qui est organisée année après année. Pour chaque année, outre des liens avec le texte intégral des oeuvres publiées cette année-là, on trouve des notes historiques, politiques et sociales, des informations scientifiques, médicales et technologiques, et des informations sur le monde littéraire.

Dans son courrier électronique du 17 juillet 1998, Patrick Rebollar expliquait:

"Pour la Chronologie littéraire, cela a commencé dans les premières semaines de 1997, en préparant un cours sur le roman fin de siècle (19e). Je rassemblai alors de la documentation et m'aperçus d'une part que les diverses chronologies trouvées apportaient des informations complémentaires les unes des autres, et d'autre part que les quelques documents littéraires alors présents dans le Web n'étaient pas présentés de façon chronologique, mais toujours alphabétique. Je fis donc un document unique qui contenait toutes les années de 1848 à 1914, et l'augmentais progressivement. Jusqu'à une taille gênante pour le chargement, et je décidai alors, fin 1997, de le scinder en faisant un document pour chaque année. Dès le début, je l'ai utilisé avec mes étudiants, sur papier ou sur écran. Je sais qu'ils continuent de s'en servir, bien qu'ils ne suivent plus mon cours. J'ai reçu pas mal de courrier pour saluer mon entreprise, plus de courrier que pour les autres activités Web que j'ai développées."

Une des autres activités de Patrick Rebollar sont ses Bookmarks, répertoire très complet des sites francophones, y compris littéraires.

Situé à l'autre bout du monde, à l'Université de Swarthmore (Pennsylvanie, USA), ClicNet est un site culturel et littéraire francophone qui propose 800 liens à des oeuvres de littérature par ordre alphabétique et par sujet, et 2.500 liens à des ressources francophones.

Des bibliothèques numérisent aussi leurs collections anciennes d'images, ce qui permet à celles-ci d'être consultées par tous et non plus seulement par un petit nombre d'élus du fait de la valeur et de la fragilité des originaux. La Bibliothèque municipale de Lyon par exemple met ses enluminures à la disposition du public. Constituée aujourd'hui de 3.000 images, sa collection d'enluminures présentera à terme plus de 10.000 images correspondant à 200 manuscrits et incunables, sur une période allant du 5e siècle à la Renaissance. Le système utilisé est le SGBI (Système de gestion de banques d'images) créé par la Maison de l'Orient à Lyon, sous l'égide du CNRS (Centre national de la recherche scientifique) et de l'Université Lyon 2.

"Chaque document, signalé par son auteur, son titre et son siècle de réalisation, représente une entité. Par un double clic sur l'entité choisie, on accède à un écran qui permet de feuilleter les images du document. Chaque écran peut comporter 9 imagettes, correspondant à des objets-images. Lorsque le document comporte davantage d'objets-images, des flèches permettent d'accéder aux objets-images suivants. Chaque objet-image peut comprendre plusieurs images, leur nombre étant indiqué sous chaque objet-image. Un double-clic sur une imagette permet de voir l'image agrandie. Dans une seconde étape, une interrogation multicritères sera possible."

Des bases de données textuelles sont accessibles par abonnement payant, par exemple FRANTEXT et l'ARTFL Project.

FRANTEXT, présent sur le Web depuis début 1995, est préparé par l'Institut national de la langue française (INaLF), une branche du CNRS (Centre national de la recherche scientifique). La base comprend, en mode interactif, 180 millions de mots-occurrences résultant du traitement informatique d'une collection représentative de 3.500 unités textuelles en arts, sciences et techniques couvrant cinq siècles (16e-20e siècles). Début 1998, 82 centres de recherche et bibliothèques universitaires d'Europe, d'Australie, du Japon et du Canada étaient abonnés, ce qui représentait 1.250 postes de travail ayant accès à FRANTEXT. Le nombre de sessions d'interrogations de la base était d'une cinquantaine par jour.

Christiane Jadelot, ingénieur d'études à l'INaLF-Nancy, expliquait dans son courrier électronique du 8 juin 1998:

"Les premières pages sur l'INaLF ont été mises sur l'Internet au milieu de l'année 1996, à la demande de Robert Martin, directeur de l'INaLF. Je peux en parler, car j'ai participé à la mise sous Internet de ces pages, avec des outils qui ne sont pas comparables à ceux que l'on utilise aujourd'hui. J'ai en effet travaillé avec des outils sous UNIX, qui n'étaient pas très faciles d'utilisation. Nous avions peu d'expérience de la chose, à l'époque, et les pages étaient très verbeuses. Mais la direction a senti la nécessité urgente de nous faire connaître par l'Internet, que beaucoup d'autres entreprises utilisaient déjà pour promouvoir leurs produits. Nous sommes en effet Unité de recherche et de service et nous avons donc à trouver des clients pour nos produits informatisés, le plus connu d'entre eux [étant] la base textuelle FRANTEXT. Il me semble que la base FRANTEXT était déja sur Internet [depuis début 1995], ainsi qu'une maquette du tome 14 du TLF [Trésor de la langue française]. Il était donc nécessaire de faire connaître l'ensemble de l'INaLF par ce moyen. Cela correspondait à une demande générale."

Comme l'indique Christiane Jadelot, l'INaLF prépare également la version en ligne du Trésor de la langue française (TLF) (Jean Nicot, 1606), dont une maquette est disponible sur le Web pour les lettres Q à S. L'oeuvre complète du TLF est disponible sur le site de l'ARTFL Project, avec recherche textuelle possible par mot ou portion de texte.

Dans son courrier électronique du 11 juin 1998, Arlette Attali indiquait les changements qu'Internet a apporté dans sa vie professionnelle:

"Etant moi-même plus spécialement affectée au développement des bases textuelles à l'INaLF, j'ai été amenée à explorer les sites du Web qui proposaient des textes électroniques et à les "tester". Je me suis donc transformée en 'touriste textuelle' avec les bons et mauvais côtés de la chose. La tendance au zapping et au survol étant un danger permanent, il faut bien cibler ce que l'on cherche si l'on ne veut pas perdre son temps. La pratique du Web a totalement changé ma façon de travailler: mes recherches ne sont plus seulement livresques et donc d'accès limité, mais elles s'enrichissent de l'apport des textes électroniques accessibles sur Internet.

[A l'avenir je pense] contribuer à développer des outils linguistiques associés à la base FRANTEXT et à les faire connaître auprès des enseignants, des chercheurs, des étudiants et aussi des lycéens."

En janvier 1998, elle a mené une enquête auprès des utilisateurs de FRANTEXT en Europe, en Australie, au Japon et au Canada pour mieux connaître ses utilisateurs. Les résultats de cette enquête sont disponibles en ligne.

L'ARTFL Project (ARTFL: American and French Research on the Treasury of the French Language) est un projet commun du CNRS (Centre national de la recherche scientifique, France) et de l'Université de Chicago (Illinois, USA), qui vise à constituer une base de données de 2.000 textes du 13e au 20e siècle concernant la littérature, la philosophie, les arts ou les sciences.

L'ARTFL travaille aussi à la version en ligne exhaustive de la première édition (1751-1772) de l'Encyclopédie ou Dictionnaire raisonné des sciences, des métiers et des arts de Diderot et d'Alembert. 72.000 articles écrits par plus de 140 collaborateurs (dont Voltaire, Rousseau, d'Alembert, Marmontel, d'Holbach, Turgot, etc.) ont fait de cette encyclopédie un monumental ouvrage de référence. Destinée à rassembler puis divulguer les connaissances de l'époque, elle porte la marque des courants intellectuels et sociaux du 18e siècle, et c'est grâce à elle qu'ont été propagées les idées du Siècle des Lumières.

Les chiffres sont éloquents quant à l'ampleur du travail: l'Encyclopédie comprend 17 volumes de texte et 11 volumes de planches, 18.000 pages de texte et 20.736.912 mots. La base de données correspondant au premier volume est accessible en ligne à titre expérimental. La recherche peut être effectuée par mot, portion de texte, auteur ou catégorie, ou par la combinaison de ces critères entre eux. On dispose de renvois d'un article à l'autre, et des liens permettent d'aller d'une planche au texte, ou du texte au fac-similé des pages originales. L'automatisation complète des procédures de saisie a entraîné quelques erreurs typographiques et des erreurs d'identification qui seront corrigées plus tard. La recherche d'images par mot, portion de texte ou catégorie sera également possible à l'avenir.

L'ARTFL travaille aussi à un projet de base de données pour le Dictionnaire de l'Académie française, dont les différentes éditions se sont échelonnées entre 1694 et 1935. Ce projet inclut la saisie, l'édition et le développement d'un moteur de recherche spécifique. Les différentes éditions pourront être combinées dans une seule base de données qui permettra de consulter aussi bien une édition particulière que l'ensemble de celles-ci pour juger de l'évolution d'un terme. Pour le moment, seules deux éditions, la première (1694) et la cinquième (1798) sont disponibles pour une recherche par mot. Une fonction de recherche en texte intégral est prévue par la suite.

Une rubrique présente une liste des autres projets de l'ARTFL, notamment la version image de l'édition de 1740 du Dictionnaire historique et critique de Philippe Bayle, le Roget's Thesaurus de 1911, le Webster's Revised Unabridged Dictionary de 1913, le Thresor de la langue française de Jean Nicot (1606), un projet multilingue sur La Bible comprenant La Bible française de Louis Segond (1910), etc.


7.3. Cyberbibliothèques non francophones

De par la quantité d'oeuvres dactylographiées à cette intention, le Project Gutenberg est la plus ancienne et la plus grande cyberbibliothèque qui existe. Créée en 1971 par Michael Hart aux Etats-Unis, elle a pour but de mettre gratuitement le plus grand nombre possible de textes à la disposition du plus grand nombre possible de lecteurs, à raison d'environ 45 titres par mois. Ses objectifs pour 2001 sont un stock de 10.000 textes littéraires et une transmission de 1.000 milliards de textes électroniques, soit 10.000 livres numériques vers 100 millions de lecteurs.

Le projet débuta en 1971 quand on donna à Michael Hart un compte de 100 millions de dollars de "temps machine" au Materials Research Lab de l'Université d'Illinois (USA). Immédiatement après avoir reçu ce crédit, il décida de le consacrer à la recherche et au stockage des oeuvres conservées dans les bibliothèques. Il décida aussi de stocker des textes électroniques de la manière la plus simple possible, en format ASCII, avec des lettres capitales pour les termes en italique, gras ou soulignés, afin que ces textes puissent être lus quels que soient la machine et le logiciel utilisés.

Cinquante heures environ sont nécessaires pour sélectionner, dactylographier, corriger et mettre en page un texte électronique. La dactylographie des textes est l'oeuvre de volontaires. Un ouvrage de taille moyenne - par exemple un roman de Stendhal ou de Jules Verne - est composé de deux fichiers ASCII.

Le Project Gutenberg inclut trois grands secteurs: la littérature de divertissement (Light Literature), comme Alice au pays des merveilles, Peter Pan ou les Fables d'Esope, la littérature "sérieuse" (Heavy Literature) comme La Bible, les oeuvres de Shakespeare ou Moby Dick, et la littérature de référence (Reference Literature), composée d'encyclopédies et de dictionnaires, par exemple le Thesaurus de Roget.

Sur le site web, Michael Hart explique que la collection de littérature de divertissement est destinée à amener devant l'écran aussi bien un enfant d'âge pré-scolaire qu'une personne du troisième âge. Des enfants ou des grand-parents vont rechercher le texte électronique de Peter Pan après avoir vu Hook au cinéma, ou bien ils lisent Alice au pays des merveilles après l'avoir regardé à la télévision. Pratiquement tous les épisodes de Star Trek ont mentionné des livres qui ont leur correspondant électronique dans le Project Gutenberg (Moby Dick, Peter Pan...). L'objectif est que les gens puissent retrouver des citations qu'ils ont entendues dans des conversations, des films, des musiques, d'autres livres, et ce à l'aide d'une bibliothèque contenant tous ces éléments dans un format facile pour la recherche.

En juillet 1997, le Project Gutenberg fêtait son vingt-sixième anniversaire avec la mise en ligne des Merry Adventures of Robin Hood de Howard Pyle. En septembre 1997, il fêtait son millième texte électronique avec la version anglaise de la Divine comédie de Dante. Dans sa lettre d'information d'octobre 1997, Michael Hart annonçait son intention de compléter la collection d'Oscar Wilde, de "séparer" les oeuvres complètes de Shakespeare en fichiers individuels pour chaque oeuvre, et de mettre en ligne des ouvrages non anglophones.

Outre l'anglais, on trouve quelques oeuvres en allemand, espagnol, français, italien et latin, mais elles ne sont pas encore légion. En janvier 1998, si on lançait une recherche sur les ouvrages disponibles en langue française, on trouvait neuf titres, dont six romans de Stendhal (L'Abbesse de Castro, La Chartreuse de Parme, La Duchesse de Palliano, Le Rouge et le Noir, Les Cenci, Vittoria Accorambani), deux romans de Jules Verne (De la terre à la lune et Le tour du monde en 80 jours) et French Cave Paintings, un ouvrage sur les peintures préhistoriques. A part l'ouvrage sur les cavernes, disponible depuis 1995, tous ces ouvrages n'ont été intégrés à la bibliothèque que début 1997. Si aucun titre de Stendhal n'était disponible en anglais, il existait trois oeuvres de Jules Verne en langue anglaise : 20,000 Leagues Under the Sea (disponible depuis septembre 1994), Around the World in 80 Days (disponible depuis janvier 1994) et From the Earth to the Moon (disponible depuis septembre 1993).

Début septembre 1998, le nombre de titres d'ouvrages en langue française était monté à onze, avec Cyrano de Bergerac, d'Edmond Rostand, disponible depuis mars 1998, et La Révolution française, de Thomas Carlyle, disponible depuis mai 1998.

Une autre importante bibliothèque électronique anglophone est The On-Line Books Page. Créée par John Mark Ockerbloom, ancien étudiant de l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, USA), elle est un répertoire de livres en accès libre sur Internet, avec un index de 7.000 livres en ligne et des liens vers d'autres répertoires et archives de textes en ligne.

Créées en été 1992 par Paul Southworth et hébergées par l'Information Technology Division de l'Université du Michigan (USA), les ETEXT Archives rassemblent des textes électroniques de toutes sortes, sans juger de leur contenu. L'équipe est entièrement composée de volontaires.

Les ETEXT Archives virent le jour pour combler le manque d'organisation observé dans les archives de documents politiques, périodiques et forums de discussion politiques et sociaux éparpillés dans Usenet, puis elles furent développées pour combler le même manque d'organisation dans l'archivage des magazines électroniques (e-zines) lorsque ceux-ci ont commencé à proliférer sur Internet.

Elles hébergent aussi gratuitement des périodiques, oeuvres de fiction, oeuvres politiques, poétiques, religieuses, etc., à la demande d'auteurs ou d'organismes souhaitant les faire connaître, après avoir sensibilisé les auteurs au respect d'une certaine éthique (pas d'ouvrages pornographiques), aux règles concernant le droit d'auteur et à l'utilisation d'un format lisible par tous (ASCII, HTML, PDF et PostScript). Par contre, le site ne propose pas de liens hypertextes avec d'autres oeuvres ou d'autres sites. Il s'en tient au but fixé, à savoir l'archivage de textes.

Proposée par Logos, une société internationale de traduction dont la maison-mère est à Modène (Italie), la Wordtheque est une bibliothèque multilingue permettant une recherche par mot dans une base de données de plus de 328 millions de termes provenant de romans, documents techniques et traductions dans de nombreuses langues. Les recherches sont possibles par langue, mot, auteur et titre. Le logiciel de recherche documentaire permet aussi l'accès au texte intégral d'oeuvres littéraires du domaine public. Si on souhaite acquérir une de ces oeuvres, un lien permet de la commander en ligne à la cyberlibrairie Amazon.com.

Entre autres outils de travail, Logos propose aussi une base de données de 553 glossaires dans Linguistic Resources, un dictionnaire multilingue de 7,5 millions d'entrées dans Multilingual Dictionary et la conjugaison des verbes en 17 langues dans Conjugation of Verbs.

Logos a été créé par Rodrigo Vergara, un réfugié politique chilien qui a émigré en Italie quand il était étudiant en agronomie pour échapper au régime du général Pinochet. Aujourd'hui, à 45 ans, il dirige une entreprise de traduction offrant des services dans plus de 35 langues, avec un réseau de 300 traducteurs dans le monde et un chiffre d'affaires de 60 millions de FF.

En décembre 1997, Rodrigo Vergara expliquait à Annie Khan, journaliste au Monde:

"Nous voulions que nos traducteurs aient tous accès aux mêmes outils de traduction. Nous les avons donc mis à leur disposition sur Internet, et tant qu'à faire nous avons ouvert le site au public. Cela nous a rendus très populaires, nous a fait beaucoup de publicité. L'opération a drainé vers nous de nombreux clients, mais aussi nous a permis d'étoffer notre réseau de traducteurs grâce aux contacts établis à la suite de cette initiative."

Dans Links to Electronic Book and Text Sites, OmniMedia Digital Publishing propose un répertoire de serveurs de livres et de textes électroniques. Première bibliothèque publique d'Internet et pour Internet, l'Internet Public Library (IPL) dispose de 20.166 documents en ligne soigneusement sélectionnés, catalogués et décrits par son personnel. La Online Book Initiative (OBI) est un projet consistant à rassembler une importante collection de textes du domaine public en format ASCII.

Créée par l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, USA), l'Universal Library a pour objectif de mettre le plus grand nombre d'ouvrages possibles à la disposition des usagers d'Internet. Elle comprend un index de plus de 5.000 oeuvres en anglais. La moitié de ces oeuvres est reliée au catalogue expérimental de la Library of Congress, si bien que - rêve enfin devenu réalité - les usagers peuvent avoir un accès direct au texte intégral de l'oeuvre à partir de la notice du catalogue.

Une très bonne série de liens vers la littérature anglophone est Literary Resources on the Net. Oeuvre de John Lynch, docteur en littérature anglaise à l'Université de Pennsylvanie (USA), le site propose des ressources littéraires en fonction des catégories suivantes : période classique et biblique, période médiévale, Renaissance, 18e siècle, période romantique, période victorienne anglaise, 20e siècle anglais et irlandais, théâtre et drame, théorie, littérature féminine et féminisme, ethnies et nationalités, autres littératures nationales, bibliographie et histoire du livre, hypertextes et divers.

La Bibliotheca universalis est un des onze projets retenus lors du Sommet du G7 des 13-17 mai 1996. Ce projet de bibliothèque électronique à l'échelon mondial "illustre la nécessité de donner à la société de l'information une ambition culturelle internationale, respectant les diversités culturelles et la pluralité linguistique". Il a "pour ambition de donner accès aux oeuvres principales du patrimoine culturel et scientifique mondial - textes, images, sons - par le biais des technologies multimédias. Il doit ainsi favoriser le dialogue culturel par-delà les frontières et améliorer les services rendus aux utilisateurs." Le projet souhaite proposer une collection universelle à partir des programmes de numérisation existants, avec environnement en réseau, système d'information distribué, fonctions de recherches avancées, et normes communes pour la numérisation des textes, des images et des sons ainsi que pour les protocoles de communication.

Ouvert en 1992, l'Electronic Text Center de l'Université de Virginie (USA) propose la combinaison d'un archivage en ligne au format SGML (standard generalized markup language) de 40.000 textes électroniques en douze langues et des 19.000 illustrations correspondant à ces textes, dont certains sont du domaine public, avec un centre comprenant le matériel informatique et les logiciels permettant la création et l'analyse de texte. French Texts and Language Resources procure des textes français en ligne et sur CD-ROM, et une série de liens menant à d'autres textes électroniques en français.

De nombreuses cyberbibliothèques sont également accessibles au moyen d'un abonnement payant, comme l'Electric Library, un centre de recherche en ligne permettant l'accès au texte intégral de 150 journaux et de centaines de magazines, 2.000 ouvrages de littérature classique, 28.000 photos, images et cartes, les transcriptions d'émissions de télévision et de radio, des résumés de livres, films et logiciels, des encyclopédies, etc., ou encore l'ACM Digital Library, créée en octobre 1997 par l'Association for Computing Machinery (ACM), organisme scientifique et de recherche international. Cette bibliothèque comprend des informations bibliographiques et des textes d'articles, ainsi qu'une section consacrée aux cyberbibliothèques et à la recherche d'information.

Ce ne sont pas seulement les textes mais aussi les images qui sont numérisés, comme on l'a vu plus haut dans Gallica, la bibliothèque numérique de la Bibliothèque nationale de France, qui a inauguré son site en 1997 par des images et textes du 19e siècle francophone.

D'autres cyberbibliothèques sont consacrées uniquement aux images, comme Corbis, société créée en 1989 par Bill Gates, patron de Microsoft. Cet ensemble d'images numériques a été constitué pour fournir des ressources d'information visuelle à l'échelon international. Parallèlement au développement de ses collections et au marketing de celles-ci, Corbis est aussi une plate-forme de recherche pour étudier les décisions à prendre en matière de normes industrielles de reproduction et de protection de la propriété intellectuelle à l'ère numérique.

Avec 25 millions d'images dont 1,4 million en ligne en décembre 1998, le fonds de Corbis est constamment enrichi par l'acquisition de droits ou la conclusion de partenariats avec de grands musées. Chaque image est accompagnée d'une légende, d'un commentaire et de mots-clés permettant une recherche thématique au moyen d'un thésaurus de 25.000 mots. La base de données est commercialisée auprès des professionnels sous forme de licences. Le grand public y a accès par Internet et par une série de CD-ROM thématiques.

Le problème majeur des bibliothèques d'images sur le Web est le temps nécessaire au téléchargement, temps proportionnel à la taille de l'image. Après avoir d'abord proposé des images "pleine page" agréables à l'oeil mais très longues à apparaître sur l'écran, de nombreux sites optent maintenant pour des images de format réduit, avec possibilité de cliquer sur ces images pour obtenir un format plus grand si nécessaire. Ce problème devrait être résolu à l'avenir avec l'augmentation de la vitesse de transmission des données.

Bien que les cyberbibliothèques anglophones soient encore très largement majoritaires, l'univers des cyberbibliothèques devient rapidement multilingue. Le Projekt Gutenberg-DE comprend plus de 200 titres de littérature allemande et de littérature étrangère en allemand. Débuté en 1992 par LYSATOR, un club informatique d'étudiants, en collaboration avec la Linköping University Library (Suède), le Projekt Runeberg regroupe 200 oeuvres de littérature nordique. Liber Liber, qui s'annonce comme la première et la plus grande bibliothèque télématique italienne, débute sa page de présentation par une maxime éloquente: "Nullus amicus magis liber quam liber." Parallèlement, les grandes cyberbibliothèques introduisent peu à peu dans leurs collections des textes en d'autres langues que leur langue dominante.


7.4. Un exemple: la toile littéraire francophone

Prise au sens large, la notion de cyberbibliothèque dépasse très largement l'ensemble des cyberbibliothèques définies comme telles. Un site littéraire est pratiquement toujours doublé d'une cyberbibliothèque. Il propose souvent le texte intégral d'oeuvres litéraires ainsi que des liens vers d'autres sites traitant de la même époque, du même auteur ou du même genre littéraire, et ainsi de suite.

On ne compte pas le nombre de sites consacrés à la littérature en général, et à la littérature francophone en particulier. On ne peut pas plus justement parler de Toile - traduction littérale du terme Web souvent adoptée par les francophones - que pour la littérature, qui sert de support à l'élaboration d'une gigantesque toile littéraire. Un passionné de littérature peut passer des journées entières à aller d'une oeuvre à l'autre et d'un site à l'autre. A l'heure actuelle, c'est la littérature du 19e et du début du 20e siècle qui est la plus fortement représentée, puisqu'une grande partie des oeuvres est du domaine public et n'est donc pas soumise au droit d'auteur et au casse-tête que la gestion de celui-ci représente encore sur le Web.

Voici quelques exemples.

CyLibris, maison d'édition sur Internet, propose une sélection de sites sur l'Internet littéraire francophone, les jeux de rôles et les journaux.

Patrick Rebollar, professeur de littérature française et d'applications informatiques à Tokyo (Japon), mène plusieurs réalisations sur le Web, par exemple la Chronologie littéraire 1848-1914. Il tient à jour une liste de signets très complète, notamment dans les domaines suivants : littérature et recherche (normes et règles, bibliothèques et éditeurs, bibliographies), revues littéraires, linguistique, dictionnaires, lexiques, recherche littéraire, documents littéraires par thèmes et par auteurs (Malraux, Sarraute, Camus, Gracq, Robbe-Grillet, etc.), oeuvres littéraires, poésie, bandes dessinées, etc.

Dans son courrier électronique du 17 juillet 1998, il expliquait:

"Animant des formations d'enseignants à l'Institut franco-japonais de Tokyo, je voyais d'un mauvais oeil d'imprimer régulièrement des adresses pour demander aux gens de les recopier. J'ai donc commencé par des petits documents rassemblant les quelques adresses web à utiliser dans chaque cours (avec Word), puis me suis dit que cela simplifierait tout si je mettais en ligne mes propres signets, vers la fin 1996. Quelques mois plus tard, je décidai de créer les sections finales de nouveaux signets afin de visualiser des adresses qui sinon étaient fondues dans les catégories. Cahin-caha, je renouvelle chaque mois. Mais les quantités de travail entraînées par le Salon du livre de Tokyo (et les interviews d'écrivains), en janvier 98, et le Festival de Yokohama (juin 1998), font qu'il y a bien longtemps que je n'ai pas fait sérieusement mon travail de veille techno-culturelle..."

Projet commun du CNRS (Centre national de la recherche scientifique, France) et de l'Université de Chicago (Illinois, USA), l'ARTFL Project (ARTFL: American and French Research on the Treasury of the French Language) est une base de données payante de 2.000 textes du 13e au 20e siècle concernant la littérature, la philosophie, les arts ou les sciences. Le site propose aussi en accès libre une intéressante liste de liens avec les serveurs de littérature française lui paraissant dignes d'intérêt.

Voici aussi quelques exemples pris dans les sites consacrés à la poésie.

Le Club des poètes est un site de poésie francophone qui souhaite la "bienvenue en territoire de poésie de la France au Chili, de Villon jusqu'à de jeunes poètes contemporains, en passant par toutes les grandes voix de la poésie de tous les temps et de tous les pays". Dans son courrier électronique du 8 juin 1998, Blaise Rosnay retraçait l'évolution de son site:

"Le site du Club des Poètes a été créé en 1996, il s'est enrichi de nombreuses rubriques au cours des années et il est mis à jour deux fois par semaine. L'Internet nous permet de communiquer rapidement avec les poètes du monde entier, de nous transmettre des articles et poèmes pour notre revue, ainsi que de garder un contact constant avec les adhérents de notre association. Par ailleurs, nous avons organisé des travaux en commun en particulier dans le domaine de la traduction. [Nos projets pour notre site sont d']y mettre encore et toujours plus de poésie. Ajouter encore des enregistrements sonores de poésie dite ainsi que des vidéos de spectacles."

Poésie française propose un choix de poèmes français de la Renaissance au début du 20e siècle. Dans son courrier du 8 juin 1998, Claire Le Parco, de la société Webnet, indiquait:

"Nous avons créé ce site lors de la création de notre société, spécialisée dans la réalisation de sites Internet et Intranet. Nous sommes des informaticiens qui aimons la poésie, et nous avions envie de montrer que poésie et Internet pouvaient faire bon ménage!"

Dans Poésie d'hier et d'aujourd'hui, Silvaine Arabo propose de nombreux poèmes, y compris les siens. Dans son courrier électronique du 8 juin 1998, elle expliquait:

"Je suis poète, peintre et professeur de lettres (13 recueils de poèmes publiés, ainsi que deux recueils d'aphorismes et un essai sur le thème: poésie et transcendance; quant à la peinture, j'ai exposé mes toiles à Paris - deux fois - et en province ). [...] Pour ce qui est d'Internet, je suis 'autodidacte' ( je n'ai reçu aucune formation informatique quelle qu'elle soit ) ; j'ai eu l'an passé l'idée de construire un site littéraire centré sur la poésie: Internet me semble un moyen privilégié pour faire circuler des idées, pour communiquer ses passions aussi. Je me suis donc mise au travail, très empiriquement, et ai finalement abouti à ce site [...] sur lequel j'essaye de mettre en valeur des poètes contemporains de talent, sans oublier la nécessaire prise de recul (Réflexions sur la poésie) sur l'objet considéré.

Ma vie professionnelle [en tant que professeur de lettres] n'en a pas été bouleversée puisqu'elle est indépendante de cette création sur Internet. Disons que très récemment, dans le cadre de mon activité professionnelle, j'ai fait avec mes élèves quelques ateliers de poésie et que, devant la pertinence de leurs productions, j'ai décidé de leur consacrer une page sur mon site ( rubrique Le jardin des jeunes poètes ). Je fais également un 'appel du pied' aux professeurs de lettres francophones pour qu'ils m'adressent des poèmes - qu'ils estiment réussis - de leurs élèves. Disons que ce site pourrait servir, entre autres, de motivation - donc de moteur - à la créativité des jeunes enfants ou des adolescents."

Voici encore quelques exemples pris dans des genres littéraires différents.

Théâtrales est une collection de textes et d'hypertextes en français sur le théâtre. Le site a été créé en mai 1995 par André G. Bourassa, professeur à l'Université de Québec à Montréal, et par Barry Russell, Visiting Fellow de l'Université Brookes d'Oxford.

Polar Web se présente comme le premier site francophone entièrement consacré au roman policier, avec des informations sur les manifestations autour du polar, une rubrique annonçant les nouveaux titres chez différents éditeurs, et la liste de tous les documents disponibles en texte intégral: livres, pages, articles, nouvelles et entretiens.

BD Paradisio est consacré à la bande dessinée en ligne avec dossiers, entretiens, biographies, dessins inédits et forums de discussion à thèmes.

Une Autre Terre est un site consacré à la science-fiction. Dans son courrier électronique du 9 juin 1998, Fabrice Lhomme, son créateur, expliquait:

"Le serveur a vu le jour fin novembre 1996. J'ai commencé en présentant quelques bibliographies très incomplètes à l'époque et quelques critiques. Rapidement, j'ai mis en place les forums à l'aide d'un logiciel "maison" qui sert également sur d'autres actuellement. [...] Depuis [la page réalisée pour le] premier anniversaire [du serveur], le phénomène le plus marquant que je puisse noter c'est la participation de plusieurs personnes au développement du serveur alors que jusque là j'avais tout fait par moi-même. Le graphisme a été refait par un généreux contributeur et je reçois régulièrement des critiques réalisées par d'autres personnes. Pour ce qui est des nouvelles, la rubrique a eu du mal à démarrer mais une fois qu'il y en a eu un certain nombre, j'ai commencé à en recevoir régulièrement (effet d'entraînement). Actuellement, j'ai toutes les raisons d'être satisfait car mon site reçoit plus de 2.000 visiteurs différents chaque mois et toutes les rubriques ont une bonne audience. Le forum des visiteurs est très actif, ce qui me ravit. Concernant les perspectives d'avenir, j'envisage pour très bientôt d'ouvrir une nouvelle rubrique proposant des livres d'occasion à vendre avec l'ambition de proposer un gros catalogue. Eventuellement, j'ouvrirai aussi une rubrique présentant des biographies car je reçois pas mal de demandes des visiteurs en ce sens. [...] Si l'activité de vente de livres d'occasion se montre prometteuse, il est possible que j'en fasse une activité professionnelle sous la forme d'une micro-entreprise."

L'actualité littéraire est présentée avec punch et humour dans ZazieWeb, revue en ligne conçue et réalisée par Isabelle Aveline, avec un graphisme d'Oliver Cornu. ZazieWeb comprend un édito, une rubrique Au fil du Net, un agenda, une revue de presse, un annuaire des sites et un self-service multimédia. Sur le site, Isabelle Aveline explique:

"ZazieWeb est un site World Wide Web professionnel et grand public indépendant, spécifiquement dédié aux libraires, éditeurs... et grand public de culture 'livre'. Conçu comme une librairie virtuelle, un espace de documentation, d'orientation et de ressources pour un public de culture 'papier' s'intéressant à Internet, il se situe aux frontières de l'écrit et de l'édition électronique. L'originalité du traitement des rubriques par rapport à un média papier étant évidemment de 'mailler' l'information avec un site sur Internet. C'est donc un site 'passerelle' vers Internet pour un public curieux et désorienté, avide de connaître ce qui se passe 'de l'autre côté de l'écran'."

Dans son courrier électronique du 8 juin 1998, elle ajoutait:

"ZazieWeb est né il y a deux ans environ: juin 96. C'était à l'époque un projet personnel qui entrait dans le cadre d'un master multimédia et que j'ai essayé de 'vendre' aux éditeurs. [...] Découvrir Internet a ouvert d'autres possibilités et surtout maintenant je ne conçois pas de ne pas travailler 'on the web'!"

On assiste aussi à l'apparition de "la littérature interactive lancée par le grand écrivain américain John Updike, qui, l'an dernier, balança sur le Web le premier chapitre d'un roman que les internautes étaient censés poursuivre", expliquait Emmanuèle Peyret dans le quotidien Libération du 27 février 1998. Cette première expérience de littérature interactive a été réalisée à l'initiative de la grande cyberlibrairie Amazon.com.

Lors de la fête d'Internet des 20-21 mars 1998, ATOS et France Loisirs ont à leur tour lancé le premier roman interactif francophone, dont le premier et le huitième et dernier chapitres ont été écrits par le romancier Yann Queffélec. Le thème du roman était le suivant: "Une femme, condamnée à mort aux Etats-Unis, bénéficie d'un sursis de 30 jours accordé par le gouverneur, avant son exécution. Que va-t-elle faire de ce répit? A quoi pense-t-elle et quel message va-t-elle laisser aux partisans et aux opposants de la peine de mort?" Le premier chapitre était disponible sur le site de France Loisirs très exactement le 20 mars 1998, premier jour de la fête d'Internet. Les cybernautes disposaient de deux semaines pour proposer un deuxième chapitre. Le jury du club devait ensuite sélectionner le meilleur chapitre qui devenait la suite officielle du roman, et ainsi de suite jusqu'au 27 juillet. France Loisirs devait publier le roman en septembre 1998.

L'hégémonie de l'anglais sur le Web? Elle était inévitable à l'époque balbutiante du Web, puisque le réseau était en premier lieu américain et ensuite essentiellement anglophone, mais ce n'est plus vrai maintenant. Tous les amoureux de la langue française n'ont plus de souci à se faire, sinon à continuer le travail entrepris, et peut-être aussi oeuvrer aussi bien pour un Web francophone que pour un Web multilingue, comme le Club des poètes, qui offre une présentation de son site en anglais, en espagnol et en portugais.


7.5. L'avenir des cyberbibliothèques

"Qu'il me suffise, pour le moment, de redire la sentence classique: 'La bibliothèque est une sphère dont le centre véritable est un hexagone quelconque, et dont la circonférence est inaccessible'."

Cette citation de Jorge Luis Borges pourrait parfaitement convenir aux cyberbibliothèques.

A court ou à long terme, leur développement rapide va certainement amener à définir la place de la cyberbibliothèque, toute récente, par rapport à la bibliothèque multicentenaire, tout comme la bibliothèque traditionnelle doit maintenant redéfinir ses fonctions du fait de l'existence des cyberbibliothèques.

La British Library par exemple n'envisage pas une bibliothèque qui devienne uniquement "cyber", et elle souhaite garder son importance à la communication physique des imprimés, manuscrits, partitions musicales, bandes sonores, etc., tout en ayant conscience de la nécessité du développement parallèle des documents numériques. Tout comme la British Library, nombreux sont ceux qui pensent que la bibliothèque réelle ne va pas disparaître parce que la cyberbibliothèque existe, de même que le livre physique ne va pas disparaître parce que son équivalent numérique existe.

"On ne peut pas, on ne pourra pas tout numériser. A terme, une bibliothèque virtuelle ne sera jamais qu'un élément de l'ensemble bibliothèque", soulignait Jean-Pierre Angremy, président de la Bibliothèque nationale de France, dans un article du Figaro du 3 juin 1998. Dès 1992, la BnF avait lancé un très important programme de numérisation, et une partie des collections numérisées est maintenant disponible sur le serveur Gallica.

Pierre Perroud, fondateur de la cyberbibliothèque Athena, expliquait dans Informatique-Informations de février 1997 que "les textes électroniques représentent un encouragement à la lecture et une participation conviviale à la diffusion de la culture", notamment pour la recherche textuelle et l'étude des textes. Il pense que ces textes "sont un bon complément au livre imprimé - celui-ci restant irremplaçable lorsqu'il s'agit de lire". S'il est persuadé de la nécessité de suivre de près l'évolution technologique et d'y adapter le monde du livre et celui de l'enseignement, il n'empêche que le livre reste "un compagnon mystérieusement sacré vers lequel convergent de profonds symboles: on le serre dans la main, on le porte contre soi, on le regarde avec admiration; sa petitesse nous rassure autant que son contenu nous impressionne; sa fragilité renferme une densité qui nous fascine; comme l'homme il craint l'eau et le feu, mais il a le pouvoir de mettre la pensée de celui-là à l'abri du Temps."

Il est vrai que, outre l'accès direct à de très nombreuses oeuvres du domaine public, l'existence des cyberbibliothèques facilite grandement la recherche textuelle sur une ou plusieurs oeuvres à la fois. Par exemple, les bases de données constituées par l'ARTFL Project permettent une recherche textuelle sur l'Encyclopédie de Diderot et d'Alembert ou le Dictionnaire de l'Académie française. Menés par plusieurs organismes, de nombreux autres projets sont en cours pour l'étude de La Bible, La Divine Comédie de Dante, l'ensemble des oeuvres de Shakespeare, etc., et ces projets permettront de disposer de bases de données incluant à la fois les textes et leurs commentaires sur plusieurs siècles.

La consultation sur écran de livres anciens offre également d'immenses perspectives. Elle permettra aux chercheurs de les visualiser et de mieux sélectionner ceux qui les intéressent avant de demander la consultation de certains originaux. Les perspectives sont grandes aussi pour les bibliothèques d'images, dans lesquelles enluminures, gravures, affiches, cartes postales, photos et films sont ou seront disponibles sur écran. Pour le moment, le temps de déchargement d'une image est encore assez long, mais cet inconvénient devrait bientôt disparaître avec l'augmentation de la vitesse de transmission des données.

Le problème majeur auquel se heurte la cyberbibliothèque à l'heure actuelle est celui du droit d'auteur. Ce problème - qui ne concerne pas seulement le livre, la revue ou l'image, mais aussi la musique, les arts graphiques, les logiciels, etc. - est fébrilement étudié par les auteurs, éditeurs, journalistes, etc.

Comment élargir la cyberbibliothèque à toutes les oeuvres et ne plus la limiter aux oeuvres du domaine public comme c'est le cas maintenant? Comment mettre en ligne les oeuvres soumises au droit d'auteur tout en respectant la législation concernant la propriété intellectuelle? Ce problème, qui concerne les cyberbibliothèques, les librairies, les éditeurs ou la presse en ligne, sous-tend le développement d'Internet dans le domaine culturel et, toujours dans le domaine culturel, son utilisation maximale comme outil de connaissance et de communication.

Un problème plus pratique est celui de l'harmonisation des formats informatiques, afin de rendre possible la lecture de tout document électronique quels que soient l'ordinateur ou le logiciel utilisés. Comme nombre de cyberbibliothèques numérisant en mode texte, le Project Gutenberg conseille l'utilisation du format ASCII (American standard code for information interchange).

Cyberbibliothèque francophone gérée par l'Association des bibliophiles universels, l'ABU donne les neuf conseils suivants aux volontaires souhaitant dactylographier des textes: 1) pas de mise en page, seulement du texte avec des lignes d'environ 70 caractères et des sauts de ligne, 2) des sauts de ligne avant chaque paragraphe, y compris pour les dialogues, 3) la transcription du tiret long accompagnant les dialogues par deux petits tirets, 4) des majuscules pour les titres, noms de chapitres et sections, avec un soulignement fait de petits tirets, 5) la transcription des mots en italique par des blancs soulignés, 6) pas de tabulation, mais des blancs, 7) la mise des notes de l'auteur entre crochets et dans le corps du texte, 8) facultativement, la pagination de l'édition originale entre crochets, 9) l'encodage final en ISO-Latin-1.

Dans L'édition savante à l'ère de la bibliothèque virtuelle: publication d'un livre en SGML sur le World Wide Web, mémoire de maîtrise en bibliothéconomie et sciences de l'information (MBSI) de l'Université de Montréal (Québec) daté de novembre 1996, Guy Teasdale répertorie tous les formats utilisés pour la communication d'un texte électronique. Le plus utilisé est le texte en format ASCII (American standard code for information interchange), pour que celui-ci puissent être lu par tous les systèmes et sur toutes les machines. On a aussi des textes formatés à partir d'un traitement de texte tel que WordPerfect ou Word, des textes en format RTF (rich text format), format créé par Microsoft, des textes de type PostScript ou PDF (portable document format) créés par Adobe, des hypertextes formatés en HTML (hypertext markup language), pour lequel Microsoft ou Netscape proposent des ajouts correspondant à leurs propres logiciels de navigation. On a enfin des textes en format SGML (standard generalized markup language), qui correspond à la norme ISO-8879:1986, format dont l'auteur démontre les avantages par rapport aux autres pour l'édition électronique de monographies spécialisées.

Guy Teasdale montre également le danger que représente l'édification d'"une tour de Babel numérisée". L'utilisation de tous ces formats est en effet assez inquiétante alors qu'un des objectifs du Web est justement de permettre la circulation de l'information à travers des réseaux hétérogènes, d'où la nécessité d'adopter un langage qui ne soit pas affecté par les nombreux changements informatiques à venir.

Etant donné le développement rapide des cyberbibliothèques sur Internet, de nombreux organismes publics et privés s'y intéressent de très près et mènent des recherches approfondies souvent disponibles en ligne. Ces organismes sont notamment la British Library et la Library of Congress, deux bibliothèques nationales pilotes dans ce domaine, ou encore la Bibliothèque de l'UC Berkeley (UC: University of California) avec son site SunSITE (financé en partie par Sun Microsystems), sur lequel elle monte ses collections et services tout en procurant informations et conseils.

Le projet Digital Library Technology (DLT) soutient le développement de nouvelles technologies permettant de faciliter l'accès public aux informations de la NASA (National Aeronautics and Space Administration) par les réseaux informatiques, particulièrement les technologies développant outils, applications, matériel informatique et logiciels permettant de répondre à l'évolution des besoins des usagers et à l'augmentation énorme des demandes d'accès.

Le Stanford Digital Libraries Project fait partie de la Digital Library Initiative, lancée en 1994 pour quatre ans et soutenue par la NSF (National Science Foundation), la DARPA (Defense Advanced Research Projects Agency) et la NASA (National Aeronautics and Space Administration).

Le serveur Library 2000 présente l'histoire du projet du MIT Laboratory for Computer Science (MIT: Massachussets Institute of Technology) entre octobre 1995 et octobre 1997. L'objectif de Library 2000, projet de recherche sur les systèmes informatiques, était d'étudier le stockage en ligne à grande échelle en utilisant comme exemple la future bibliothèque électronique. Il s'agissait d'un projet pragmatique, qui a permis de développer un prototype utilisant la technologie et les configurations de systèmes économiquement viables en l'an 2000.

Financé par la DARPA (Defense Advanced Research Projects Agency), D-Lib Magazine est un magazine de recherche sur les cyberbibliothèques, qui comprend l'actualité mensuelle, des commentaires, des discussions et des ressources pour la recherche.

Organisme international indépendant à destination des bibliothécaires du monde entier, l'International Federation of Library Associations and Institutions (IFLA) consacre une passionnante section aux collections et services électroniques.


Chapitre 8: Les catalogues en ligne
Table des matières


De l'imprimé à Internet
Page d'accueil du Livre 010101
Page d'accueil du NEF


© 1999 Marie Lebert