NEF - Le Livre 010101 de Marie Lebert - Articles

Cyberbibliothèques. 1. Deux grandes catégories

paru dans E-Doc n° 5, 6 juillet 2000

Appelée aussi bibliothèque numérique, bibliothèque électronique ou bibliothèque virtuelle, quoique bien réelle sur écran, la cyberbibliothèque est peut-être l'apport majeur procuré par Internet au monde de l'imprimé. Il existe deux types de cyberbibliothèques: celles qui numérisent elles-mêmes leurs documents, et celles qui répertorient les ouvrages numérisés disponibles sur le Web.

Comment définir la cyberbibliothèque?

Désormais des millions d'ouvrages littéraires et scientifiques, périodiques, travaux universitaires et de recherche, documents iconographiques, etc., sont disponibles à l'écran, et le mouvement va en s'amplifiant. Chose enfin possible, on peut consulter, immédiatement et à tout moment, des ouvrages (et autres documents) jusque-là difficiles d'accès, pour des raisons diverses : éloignement géographique, horaires de consultation peu pratiques, justificatifs à donner, bordereaux à remplir, attente interminable, etc.

Bien entendu, les efforts pour rendre le "livre" accessible au plus grand nombre ne datent pas d'hier. Depuis la Révolution française, on nous promettait régulièrement un accès démocratique, libre et gratuit au "savoir" - les collections appartenant précédemment à la noblesse et au clergé avaient été regroupées dans les bibliothèques municipales à cette intention - sans en avoir jusque-là les moyens, ou en donnant aux bibliothèques des moyens beaucoup trop limités (à quelques exceptions près).

Entre moult qualités, la bibliothèque numérique nécessite un stockage infiniment moindre qu'une bibliothèque d'imprimés, son contenu peut être copié ou sauvegardé par voie électronique, les documents anciens et/ou fragiles peuvent être consultés sans être abîmés, la recherche sur son contenu est automatisée, et elle permet une réduction importante des coûts à tous niveaux.

Bibliothèque pionnière en Europe dans sa réflexion sur la cyberbibliothèque (au moins pour ce qui est des documents d'étude disponibles dès 1997 sur le Web), la British Library la définit comme une entité résultant de l'utilisation des technologies numériques pour acquérir, stocker, préserver et diffuser des documents. Ces documents sont soit publiés directement sous forme numérique, soit numérisés à partir d'un document imprimé ou audiovisuel. Une collection numérique devient une bibliothèque numérique quand elle répond aux quatre facteurs suivants :
1) elle peut être créée et produite dans un certain nombre d'endroits différents, mais elle doit être accessible en tant qu'entité unique,
2) elle doit être organisée et indexée pour un accès aussi facile que possible,
3) elle doit être stockée et/ou gérée de manière à avoir une existence assez longue après sa création,
4) elle doit trouver un équilibre entre le respect du droit d'auteur et les exigences universitaires.

Pour ma part, je distinguerai deux grandes catégories de cyberbibliothèques:
a) celles qui numérisent elles-mêmes leurs documents (par exemple Gallica, ABU: la bibliothèque universelle, La Bibliothèque électronique de Lisieux, Athena ou le Projet Gutenberg),
b) celles qui répertorient les ouvrages numérisés disponibles sur le Web (par exemple la Chronologie littéraire 1848-1914, ClicNet, The On-Line Books Page ou The Internet Public Library).

Certaines offrent les deux services : par exemple Athena qui propose aussi une série de liens vers d'autres ressources, ou ClicNet qui édite un certain nombre de documents.

Des cyberbibliothèques numérisant elles-mêmes leurs documents

Créée en octobre 1997 par la Bibliothèque nationale de France (BnF), Gallica est une des plus importantes bibliothèques électroniques existant sur le réseau. Elle met en accès libre 80.000 documents - imprimés numérisés en mode image, documents numérisés en mode texte, images fixes - allant du Moyen-Age au début du XXe siècle. Les ressources en mode texte proviennent de la base Frantext de l'INALF (Institut national de la langue française) et d'une coopération avec les éditeurs Acamédia, Bibliopolis et Honoré Champion.

Depuis 1993, les membres bénévoles de l'Association des bibliophiles universels (ABU) constituent peu à peu les collections de ABU: la bibliothèque universelle en dactylographiant eux-mêmes des oeuvres francophones du domaine public. A ce jour, les collections comprennent 267 textes de 90 auteurs. On n'ose pas demander combien de lignes, ni combien d'heures de travail. Derniers titres disponibles: Qu'est-ce que la propriété?, de Pierre-Joseph Proudhon, Germinal d'Emile Zola, et Les Confessions de Jean-Jacques Rousseau.

C'est le personnel de la bibliothèque municipale de Lisieux (Normandie) qui saisit les textes de La Bibliothèque électronique de Lisieux (466 textes de 120 auteurs), créée en juin 1996 à l'initiative d'Olivier Bogros, directeur de la bibliothèque. Cette bibliothèque électronique propose la version intégrale d'une oeuvre littéraire - avec une nouvelle oeuvre chaque mois (Le Réquisitionnaire d'Honoré de Balzac en juin 2000) -, les archives des mois précédents, des sélections d'oeuvres courtes du XIXe siècle, du fonds documentaire et du fonds normand, ainsi qu'un choix de sites normands et de sites littéraires francophones.

Débuté en 1994 et hébergé par l'Université de Genève, Athena, oeuvre de Pierre Perroud, est un ensemble de textes, bases de données, programmes de recherche et images. Une partie du site est consacrée à sa table de minéralogie, qui fait référence dans le monde entier. Les textes édités par Athena - après avoir été dactylographiés ou scannés par des volontaires - sont principalement des oeuvres littéraires classiques d'auteurs francophones et/ou suisses. Dans les ouvrages récemment mis en ligne figurent le Traité des passions de l'âme de René Descartes et Le devin du village de Jean-Jacques Rousseau. Le site donne également accès à 10.000 documents en plusieurs langues dans divers domaines (philosophie, sciences, littérature, histoire, économie, etc.).p>

Créé par Michael Hart en 1971 alors qu'il était étudiant à l'université de l'Illinois (USA), le Projet Gutenberg s'est donné comme "mission" de mettre gratuitement à la disposition de tous le plus grand nombre possible d'oeuvres du domaine public. La plus ancienne bibliothèque numérique sur Internet propose désormais 2.600 oeuvres patiemment numérisées en mode texte par des volontaires de nombreux pays (600 volontaires à ce jour). D'abord essentiellement anglophones, les collections deviennent peu à peu multilingues. En juin 2000, l'équipe a numérisé des oeuvres de Rudyard Kipling et de Goethe (en allemand pour ces dernières). Elle a continué la numérisation du Human Genome Project (Projet de génome humain), ouvrage encyclopédique dont on a beaucoup parlé ces derniers temps et qui est du domaine public. Le programme de juillet 2000 comprend notamment la numérisation de plusieurs pièces de Shakespeare.

Des cyberbibliothèques répertoriant les ouvrages numérisés disponibles sur le Web

Créée début 1997 par Patrick Rebollar, professeur de français, de littérature française et d'applications informatiques installé à Nagoya et Tokyo (Japon), la Chronologie littéraire 1848-1914 est organisée année après année. Pour chaque année, outre des liens avec le texte intégral des oeuvres publiées cette année-là, on trouve des notes historiques, politiques et sociales, des informations scientifiques, médicales et technologiques, et des informations sur le monde littéraire.

Depuis juillet 1995, sur le site de l'Université de Swarthmore (Pennsylvanie, USA), Carole Netter gère ClicNet, qui "édite ou localise des ressources virtuelles en français pour les étudiants, les enseignants de français langue étrangère, et tous ceux qui s'intéressent aux cultures, aux arts et aux littératures francophones". 3.000 liens renvoient à des oeuvres littéraires (par ordre alphabétique et par sujet) et des ressources francophones. Par ailleurs, Carole Netter édite elle-même des textes littéraires classiques et contemporains, des recherches littéraires et pédagogiques, des bibliographies, des entretiens et des anthologies.

Pour ce qui est des cyberbibliothèques anglophones, on peut signaler The On-Line Books Page, créée en 1993 par John Mark Ockerbloom, et qui recense 11.000 oeuvres en ligne. Après avoir été hébergé sur le site de l'Université Carnegie Mellon (CMU, Pittsburgh, Pennsylvanie, USA), ce répertoire est désormais intégré à la bibliothèque numérique de l'université de Pennsylvanie.

Initiative originale due à l'Institut des sciences de l'information de l'Université du Michigan (USA), The Internet Public Library (IPL), débutée en juin 1996, a été la première bibliothèque publique créée directement sur Internet pour sélectionner, décrire et cataloguer les ressources Web dignes d'intérêt (34.000 pages et sites Web recensés en juin 2000). L'IPL propose aussi la Online Literary Criticism Collection, un répertoire de sites critiques et biographiques sur les auteurs littéraires (3.800 auteurs) et leurs oeuvres, pour tous pays et toutes périodes.

Les cyberbibliothèques qu'on vient de décrire ne sont bien sûr que quelques exemples parmi tant d'autres. Pour un survol exhaustif, merci de vous reporter à l'excellent répertoire proposé par Pierre Perroud dans Athena Literature Resources.

Les bibliothèques numérisant elles-mêmes leurs documents ont le choix entre la numérisation en mode texte et la numérisation en mode image. La numérisation en mode texte implique la saisie de l'oeuvre ligne après ligne, ou bien la scannérisation suivie d'une relecture. La numérisation en mode image correspond à la "photographie" du livre page après page. Elle est beaucoup moins coûteuse certes, mais n'offre pas les mêmes avantages au lecteur. Ceci sera le sujet de notre prochain article: Cyberbibliothèques. 2. Numérisation en mode texte ou en mode image?


Liste des articles
Page d'accueil du Livre 010101
Page d'accueil du NEF


© 2000 Marie Lebert