NEF - Le Livre 010101 de Marie Lebert - De l'imprimé à Internet

De l'imprimé à Internet (1999)
8. Les catalogues en ligne

Pourquoi un chapitre entier sur les catalogues? Parce que, dans le domaine de l'imprimé, le catalogue correspond au cerveau chez l'être humain. Il permet de répertorier et présenter les documents de manière systématique. Que l'on soit professionnel du livre, étudiant, chercheur ou cybernaute voulant se documenter sur un sujet donné, l'utilisation du catalogue est une étape indispensable pour trouver les documents souhaités.

Par le passé, on a pu reprocher aux catalogues d'être austères, peu conviviaux, et surtout de donner les références du document mais en aucun cas l'accès à son contenu. Depuis qu'ils sont disponibles sur Internet, les catalogues sont moins austères et plus conviviaux. Et surtout - rêve de tous qui commence à devenir réalité - ils vont progressivement permettre l'accès aux documents eux-mêmes. Ceci est déjà vrai dans certains cas, comme par exemple 2.500 oeuvres de l'Universal Library accessibles par le biais de l'Experimental Search System (ESS) de la Library of Congress.

Le souci de mettre en place des catalogues collectifs ne date pas d'hier. Pendant des décennies, les bibliothécaires et documentalistes ont catalogué le même ouvrage au même moment dans leur propre bibliothèque, d'abord dans des registres reliés, ensuite dans des catalogues sur fiches. Quand ils en avaient les moyens, leur catalogue était imprimé pour être diffusé à l'échelon régional, national ou international. L'ère des catalogues sur fiches fut longue et elle n'a pas encore disparu. Les salles entières de catalogues sur fiches rangés dans de multiples tiroirs en bois - la salle des catalogues de la Bibliothèque publique et universitaire de Genève par exemple - ont fait et font toujours l'admiration de tous. Par contre l'informatique a rapidement rendu obsolètes les machines qui dupliquaient les fiches cartonnées ou encore les sociétés prestataires de services vendant des fiches cartonnées à partir d'une liste de ISBN (international standard book number).

Depuis bientôt vingt ans, suite à l'informatisation progressive de tous les services, de nombreuses tentatives plus ou moins réussies ont permis aux bibliothécaires d'unir leurs forces au lieu d'effectuer le même travail en de multiples exemplaires.

En France par exemple, le Catalogage national centralisé (CANAC) a été suivi de Libra, un logiciel en temps réel proposé par la Direction du livre et de la lecture, qui a lui-même été suivi par le Catalogue collectif national des publications en série (CCN-PS), un réseau coopératif de catalogage sur SIBIL (Système intégré pour les bibliothèques universitaires de Lausanne) et par le Pancatalogue, dérivé du OCLC Online Union Catalog, explique Thierry Samain dans L'accès aux catalogues des bibliothèques par Internet.

Nombreuses sont aussi les bibliothèques qui ont utilisé le catalogue sur CD-ROM de la Bibliothèque nationale de France pour "récupérer" les notices de la BnF et les intégrer à leur propre catalogue. Avec Internet, on aborde enfin une nouvelle étape qui, si elle n'est pas sans difficultés, résoud le problème majeur de la communication au plus grand nombre.

Dans ce chapitre, on présentera d'abord quelques catalogues et répertoires de catalogues francophones. On présentera ensuite les catalogues de très grandes bibliothèques comme ceux de la Library of Congress ou de la British Library, ainsi que deux catalogues collectifs mondiaux qui constituent des "réservoirs" de notices pour les professionnels du livre. On abordera enfin l'avenir des catalogues sur Internet, un futur qui semble assez prometteur puisqu'il rendra plus accessible et donc plus familier un univers jusque là réputé pour son aridité.

8.1. Catalogues de bibliothèques francophones
8.2. Catalogues de bibliothèques non francophones
8.3. Catalogues collectifs mondiaux
8.4. L'avenir des catalogues en ligne


8.1. Catalogues de bibliothèques francophones

Le site web de la Bibliothèque nationale de France ne propose pas encore ses catalogues Bn-Opale (livres et périodiques) et Bn-Opaline (collections spécialisées) en libre accès sur le Web. Ces catalogues sont disponibles moyennant un abonnement à Telnet, un système permettant d'utiliser son micro-ordinateur comme un simple terminal afin de pouvoir consulter le catalogue à distance de la même manière que si on se trouvait sur place.

On peut par contre consulter directement sur le Web le Catalogue des imprimés en libre accès, qui donne le signalement de 430.000 documents de référence imprimés et audio-visuels accessibles au public dans les nouveaux locaux de Tolbiac, inaugurés en 1996.

Bn-Opale contient plus de deux millions de références correspondant aux collections suivantes: les livres entrés par dépôt légal, achat, don ou échange depuis 1970, les périodiques entrés par dépôt légal, abonnement, don ou échange depuis 1960, les ouvrages anonymes des 16e-18e siècles (catalogue en cours de constitution), les microformes de sauvegarde commercialisées par le Service de la reproduction, et les documents informatiques depuis 1994. Bn-Opale inclut aussi le catalogue partagé avec des bibliothèques universitaires ou spécialisées, le catalogue partagé du dépôt légal en relation avec les bibliothèques régionales habilitées au dépôt légal pour l'édition régionale, la production de la Bibliographie nationale française (livres, publications officielles et publications en série, soit au total 48.000 références par an).

Bn-Opale n'inclut pas les notices d'ouvrages antérieurs à 1970 et de périodiques antérieurs à 1960. Celles-ci ne sont pour le moment disponibles que sur le CD-ROM du Catalogue général des Imprimés de la Bibliothèque nationale de France.

La base Bn-Opaline comprend des documents spécialisés (cartes, plans, estampes, etc.) entrés par dépôt légal, achat, don et échange, des microformes établies par le Centre de Sablé et des documents entrés dans les bibliothèques partenaires de la Bibliothèque nationale de France. La répartition des notices bibliographiques est la suivante: 82.377 cartes et plans depuis 1987, 54.928 estampes et photographies depuis 1988, 281.068 documents audiovisuels depuis 1989, 35.076 partitions musicales depuis 1991, 4.944 monnaies et médailles depuis 1994, et 1.655 documents concernant les arts du spectacle depuis 1995.

Depuis plusieurs années, un certain nombre de catalogues de bibliothèques publiques sont disponibles sur le Minitel, ce qui permet leur consultation dans nombre de foyers et de lieux publics. La consultation est possible soit directement sur un Minitel, soit sur un micro-ordinateur utilisé en émulation Minitel. Les notices ne peuvent cependant pas être affichées de manière détaillée, et le mode "feuilletage" ne peut pas être utilisé sur un grand nombre d'écrans successifs, ce qui explique l'attrait que représente le transfert progressif de ces catalogues sur Internet où ces fonctions sont possibles.

Comme les bases Bn-Opale et Bn-Opaline de la Bibliothèque nationale de France, un grand nombre de catalogues - y compris ceux des bibliothèques universitaires - sont maintenant disponibles par le biais de Telnet. Un code d'accès et un mot de passe permettent de se connecter à l'OPAC (online public access catalogue) de la bibliothèque. Telnet, malgré les services considérables qu'il a rendu et qu'il rend encore, présente des inconvénients du fait du fonctionnement différent de chaque OPAC, des configurations différentes de claviers, etc. La formule de l'accès libre sur le Web adoptée par la British Library ou la Library of Congress par exemple est évidemment beaucoup plus pratique.

Un autre système est l'accès des catalogues par WAIS (wide area information server). Ce système est utilisé pour les bibliothèques de laboratoires et d'unités de recherche dans le domaine scientifique et technique. Ses principaux avantages sont "un accès réparti à différents catalogues, un mode d'interrogation simple, un coût nul, le logiciel étant facilement disponible dans le domaine public, une technique ne nécessitant pas de gros investissements", explique Thierry Samain dans L'accès aux catalogues des bibliothèques par Internet.

Du fait de l'essor d'Internet, un nombre croissant de bibliothèques est en train d'établir un accès direct et gratuit à leur catalogue à partir de leur site web, moyennant une interface spécifique. L'accès direct par le Web offre de nombreux avantages, à commencer par celui de l'utilisation de la souris. L'usager a le choix entre au moins deux types de recherche, simple et avancée, et il peut sélectionner plusieurs critères complémentaires tels que le nombre d'enregistrements souhaités ou bien le mode de classement. Il peut dérouler plusieurs pages de notices abrégées ou complètes. Les notices sélectionnées peuvent être copiées, imprimées, sauvegardées ou bien envoyées par messagerie électronique. Des liens hypertextes permettent de passer facilement d'une recherche à une autre. On peut également intégrer au catalogue des images, extraits sonores ou bandes vidéo.

La meilleure formule serait l'utilisation à grande échelle de la norme Z39.50, norme nationale américaine utilisée par exemple pour la consultation du catalogue de la Library of Congress. La norme Z39.50 définit un protocole pour la recherche documentaire d'un ordinateur à un autre. L'utilisateur d'un système peut ainsi rechercher des informations chez les utilisateurs d'autres systèmes utilisant la même norme, sans devoir connaître la syntaxe de recherche utilisée par ces systèmes. L'Union européenne a entrepris des recherches pour favoriser l'utilisation de cette norme en Europe.

Parallèlement à ces améliorations techniques, on voit se développer des catalogues collectifs visant à faire connaître les ressources disponibles à l'échelon régional, national et international.

Situé sur le site de la Bibliothèque nationale de France, le Catalogue collectif de France (CCFR) permet de "trouver des informations détaillées sur les bibliothèques françaises, leurs collections et leurs fonds (anciens, locaux ou spécifiques), connaître précisément les services qu'elles rendent et interroger leur catalogue en ligne". A compter du premier trimestre 1999, il permettra aussi de "localiser des ouvrages (documents imprimés, audio, vidéo, multimédia) dans les principales bibliothèques et demander le prêt ou la reproduction des documents" qui seront remis à l'usager dans la bibliothèque de son choix.

Plusieurs réseaux régionaux ont également vu le jour. Voici trois exemples.

Né en 1988, le réseau BRISE (Bibliothèques en réseau informatisé de Saint-Etienne) dispose d'un catalogue collectif pour les bibliothèques municipales et celles des établissements d'enseignement supérieur.

Le Pôle européen universitaire et scientifique de Grenoble a mis en place REDOC (Réseau documentaire du site de Grenoble), disponible sur le Web avec des liens hypertextes entre le serveur commun et les services répartis, le but étant de donner accès aux catalogues et aux collections électroniques des bibliothèques et centres de documentation de l'agglomération grenobloise.

D'autres réseaux se sont développés avec consultation des catalogues et autres services, par exemple le Réseau des bibliothèques des universités de Toulouse, le Réseau IRIS pour la Région Provence-Alpes-Côte d'Azur ou encore RéVOdoc, le réseau documentaire du Val-d'Oise.

Plusieurs répertoires ont été créés pour accéder aux sites et aux catalogues des bibliothèques françaises et francophones. Proposé par l'Ecole nationale supérieure des sciences de l'information et des bibliothèques (ENSSIB) et réalisé par Thierry Samain, le répertoire des catalogues de bibliothèques francophones est classé en plusieurs rubriques: bibliothèques générales, arts, droit et économie, lettres et sciences humaines, médecine, sciences de l'information et bibliothèques, sciences et techniques. Plusieurs autres répertoires de catalogues sont recensés dans Sitebib, qui est le résultat de la coopération entre sites web en bibliothéconomie et sciences de l'information.


8.2. Catalogues de bibliothèques non francophones

Deux catalogues, celui de la British Library et celui de la Library of Congress, constituent d'excellents outils bibliographiques pour les cybernautes du monde entier.

En mai 1997, la British Library a lancé OPAC 97, un catalogue en ligne permettant l'accès libre et gratuit aux catalogues de ses principales collections à Londres et à Boston Spa. Rassemblées depuis 250 ans, ces collections représentent 150 millions de documents appartenant à toutes les civilisations, dans toutes les langues et dans tous les domaines.

Les catalogues présents dans OPAC 97 concernent notamment les livres et périodiques du Royaume-Uni et de l'étranger, la collection des humanités et des sciences sociales depuis 1975, notamment un fonds oriental, un fonds hispanique et une des plus grandes collections européennes sur l'Europe de l'Est et la Russie, la collection des sciences et technologies et du monde des affaires depuis 1975, la collection de musique depuis 1980, la collection de périodiques britanniques et étrangers depuis 1700 (500.000 titres) et la collection de compte-rendus de conférences depuis 1800 (la plus grande collection mondiale).

A l'heure actuelle, ces différentes collections ont chacune leur propre catalogue, correspondant souvent à un domaine spécifique. Le Corporate Bibliographic Programme (CBP) étudie la création d'une seule base de données, à la fois pour un meilleur développement des collections et pour une meilleure utilisation du catalogue par les usagers. Le même programme étudie aussi le remplacement des systèmes informatiques actuels - qui ont maintenant vingt ans - par un système plus performant à la fois pour les besoins de la bibliothèque et pour la coopération avec ses nombreux partenaires.

Le catalogue de la Library of Congress est le plus grand catalogue en ligne du monde, et sa consultation est gratuite, avec menus de consultation en anglais et en espagnol. On y trouve les références de documents dans de très nombreuses langues, y compris en français.

La recherche s'effectue au moyen de la norme Z39.50 et suivant quatre procédés: recherche par mots, recherche par liste, recherche par commandes par le biais de Telnet pour la connexion à LOCIS (Library of Congress Information System), et recherche par l'Experimental Search System (ESS).

La recherche par mots peut s'effectuer à deux niveaux: recherche simple et recherche avancée.

La recherche simple est effectuée par titre (tout ou partie du titre, du sous-titre ou de la mention de responsabilité) ou par auteur personnel (un seul auteur). Elle permet l'accès aux principaux catalogues de la Library of Congress: le catalogue des livres, les catalogues des documents informatiques (notices bibliographiques des logiciels et documents en langage informatique), les catalogues des documents en cours de traitement, les catalogues JACKPHY (notices bibliographiques des publications en caractères autres que les caractères romains: japonais, arabe, chinois, coréen, persan, hébreu et yiddish), le catalogue des manuscrits, le catalogue des cartes, le catalogue de la musique, le catalogue des périodiques et le catalogue des documents visuels, soit environ 6,3 millions de notices.

La recherche avancée permet la combinaison de critères multiples à l'aide d'opérateurs boléens (and, or, and not, correspondant aux opérateurs boléens français: et, ou, sauf).

Le moyen le plus rapide de trouver un document est l'utilisation du LCCN (Library of Congress control number), de l'ISBN (international standard book number) ou de l'ISSN (international standard serial number). Si on ne dispose pas d'un de ces nombres, on peut combiner les éléments suivants: titre, auteur personnel, auteur collectif, collection, sujet ou note, en utilisant un mot, une liste de mots ou une expression. Un mot est défini comme un groupe de caractères sans espace. Une liste de mots est définie comme deux ou plusieurs mots séparés par un espace, sans exigence concernant l'ordre des mots. Une expression est définie comme un ou plusieurs groupes de caractères séparés par des espaces et dans lesquels l'ordre des mots doit être respecté.

La recherche avancée donne accès au catalogue des autorités pour les noms et les sujets (environ 4 millions de notices en 1997), le National Union Catalog (publications cataloguées par d'autres bibliothèques et non encore intégrées aux collections de la Library of Congress) et le catalogue PreMARC (notices cataloguées antérieurement aux dates officielles auxquelles les différents catalogues ont débuté).

La recherche par liste permet une première sélection au moyen d'un index alphabétique des termes utilisés dans les catalogues de la Library of Congress: livres, périodiques (magazines, journaux et autres publications paraissant de manière régulière et continue), documents cartographiques (cartes, atlas, etc.) et microformes. Les renvois utilisés dans la recherche par sujet sont également indiqués dans l'index alphabétique. On peut effectuer la recherche par sujet, auteur (personnel ou collectif), nom de conférence, titre, nom de périodique, classification de la Library of Congress (qui correspond à une partie de la cote) ou numéro de la classification décimale de Dewey. On peut également rechercher le "numéro d'identité" exact du document, par exemple l'ISBN (international standard book number), l'ISSN (international standard serial number) ou le LCCN (Library of Congress control number).

La Library of Congress a également lancé l'Experimental Search System (ESS), qui est un système permettant de consulter tout un ensemble de catalogues grâce une seule interface composée de plusieurs pages de recherche (simple, avancée, par nombre ou par liste) et plusieurs pages de résultats (avec une liste de notices abrégées ou bien des notices complètes), en liaison avec des fichiers d'aide en ligne. Son but est de favoriser une recherche plus intuitive que celle du traditionnel OPAC (online public access catalogue), grâce à la synergie entre le lien de l'hypertexte et l'engin de recherche spécifique InQuery créé par la société Sovereign Hill Software.

La consultation de l'OPAC par le biais du traditionnel catalogue en ligne est cependant encore indispensable puisque plusieurs catalogues de livres et la plupart des catalogues de "non-livres" (microformes, articles, manuscrits, etc.) ne sont pas encore présents dans l'ESS. Le menu de recherche avancée précise les bases de données et les collections disponibles par rubrique, et la quantité de documents pour chaque rubrique.

Le 20 décembre 1998, l'ESS comprend les notices de 9,5 millions de livres, incluant les notices JACKPHY (notices en japonais, arabe, chinois, coréen, persan, hébreu et yiddish), 825.664 périodiques, 278.771 documents visuels tels que films, films fixes ou vidéos, 68.135 images et photos, 209.142 enregistrements sonores et partitions musicales, 171.756 cartes, 10.698 manuscrits et 6.318 logiciels. Les notices de 140.000 photos et manuscrits de la National Digital Library Program's American Memory sont reliées à plus de 70.000 photos et images numériques disponibles en ligne. Grâce à l'indexation des oeuvres sélectionnées et classées par l'Universal Library de l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, USA), l'ESS procure aussi les liens au texte intégral de 2.500 oeuvres en ligne disponibles sur différents sites.

L'intérêt d'un tel catalogue est expliqué sur le site web: c'est sa capacité à montrer les relations existant entre les termes en texte libre, le vocabulaire contrôlé (par exemple les principaux sujets de la Library of Congress) et les schémas de classification. Comme, de plus en plus, les textes de documents gouvernementaux ou du domaine public seront disponibles en ligne, ils seront reliés aux notices bibliographiques afin d'être accessibles par un seul point d'entrée. Cette nouvelle infrastructure préfigure une bibliothèque électronique nationale. Comme on l'a vu plus haut, l'ESS ne remplace pas les catalogues traditionnels, mais le fait qu'il permette l'accès immédiat aux textes et documents numériques permettra d'encourager la migration des catalogues traditionnels dans cette direction.

L'ESS préfigure ce que sera le catalogue à l'avenir: non plus seulement un ensemble de notices qui sont le prélude à un parcours du combattant pour trouver les documents, le plus souvent par prêt interbibliothèques, mais un ensemble de notices qui permettront l'accès immédiat au texte intégral du document.

Gérées par des sociétés privées, les bases commerciales telles que Dialog, LEXIS-NEXIS ou UnCover préfigurent aussi ce que sera la recherche numérique de demain, en attendant que les organismes publics prennent le relais. Depuis plusieurs années, ces bases associent catalogues et documents en ligne (ou envoyés par télécopieur dans le cas de UnCover). Leur seul défaut, et de taille, est que leurs coûts sont vite prohibitifs pour un particulier (et ce malgré un compteur permettant de consulter en continu la somme facturée afin d'éviter les mauvaises surprises!).

Gérée par Knight-Ridder Information, la Dialog Corporation comprend un certain nombre de bases documentaires dont la plus connue, Dialog, regroupe 450 bases de données sur le monde des affaires, l'industrie, l'actualité, les droits et brevets, la chimie, l'environnement, les sciences et techniques et les outils de référence. Une recherche par mots-clés permet d'opérer une sélection dans les dizaines de milliers de documents disponibles. Le serveur donne ensuite une liste bibliographique de tous les documents correspondant à la recherche lancée.

Les avantages de cette recherche automatisée sont énormes si on pense aux centaines de tables des matières ou d'index qu'il faudrait parcourir pour arriver au même résultat. A partir de cette bibliographie, on peut ensuite sélectionner quelques documents et demander leur envoi par voie informatique. Là aussi, le service est très coûteux. C'est la raison pour laquelle les services documentaires contrôlent de près les requêtes de leurs usagers sur Dialog.

LEXIS-NEXIS est un fournisseur international de services d'information et d'outils de gestion (en ligne, sur Internet, sur CD-ROM et sur support papier) à l'intention des professionnels du droit, de l'actualité et des affaires. Avec des clients dans plus de 60 pays, la société fait partie de Reed Elsevier (Londres), grande société d'édition et d'information.

Proposé par la CARL Corporation, UnCover permet de se procurer des articles provenant de 17.000 périodiques couvrant tous les domaines depuis 1988. Si l'envoi d'articles est payant, la recherche dans la base de données, les tables des matières des périodiques et l'index par mots-clés est gratuite.

Coût excepté, ces trois bases commerciales sont un exemple de ce que peuvent être les catalogues de demain, qui trouveront tout leur sens quand ils donneront accès aux documents numérisés.


8.3. Catalogues collectifs mondiaux

Internet, réseau mondial, rend possible la gestion de catalogues à l'échelle internationale. C'est ce que font deux associations basées aux Etats-Unis, le OCLC Online Computer Library Center et le Research Library Information Network (RLIN), qui gèrent des "réservoirs" de notices alimentés par les bibliothèques adhérentes, ce qui permet aux bibliothécaires d'unir leurs forces par-delà les frontières.

Le OCLC Online Computer Library Center est une association à but non lucratif proposant à ses membres - le plus souvent des bibliothèques et centres de documentation - toute une gamme de services avec deux objectifs: favoriser l'accès à l'information à l'échelon international et réduire les coûts correspondants.

Mais, dans l'esprit de nombreux bibliothécaires et documentalistes, le sigle OCLC est d'abord synonyme de catalogue. Depuis 1971, OCLC gère le OCLC Online Union Catalog, qui est devenu le plus grand catalogue collectif mondial avec ses 38 millions de notices en 370 langues (avec translitération pour les caractères non-romains) et ses 25.000 bibliothèques adhérentes. L'accroissement annuel est de 2 millions de notices. Les huit formats bibliographiques utilisés correspondent aux types de documents suivants: livres, périodiques, documents visuels, cartes et plans, documents mixtes, enregistrements sonores, partitions et documents informatiques.

Le but du OCLC Online Union Catalog part d'une idée simple propre à tous les catalogues collectifs: gagner du temps en évitant à de multiples catalogueurs de cataloguer la même publication au même moment. L'idée géniale était d'utiliser Internet et d'étendre le catalogue collectif au monde entier. Si le catalogueur trouve la notice, il la copie pour sa propre base. S'il ne trouve pas la notice, il la crée, et cette notice est aussitôt disponible pour les catalogueurs suivants. La même règle vaut pour les catalogueurs de Paris (France), Tokyo (Japon) ou Canberra (Australie).

Contrairement à RLIN qui, lui, propose plusieurs notices pour le même document dans la mesure où celui-ci a été catalogué par différentes bibliothèques, OCLC enregistre seulement la première notice et demande instamment à ses adhérents de ne pas créer de double. Ceux-ci sont tenus d'utiliser la notice existante quand un document a déjà été catalogué, et ils ne créent une notice sur le réseau qu'après avoir vérifié l'absence d'une notice pour le document en question. Les notices sont créées en format USMARC (US machine readable catalog) selon les normes de catalogage AACR2 (Anglo-American cataloguing rules, version 2). Les notices de base disponibles sur le réseau ne peuvent être modifiées que par les bibliothèques habilitées à le faire parce qu'elles disposent d'une équipe de catalogueurs très expérimentés.

OCLC vit le jour en 1967. En 1967, les présidents des collèges et universités de l'Ohio fondèrent le Ohio College Library Center (OCLC) afin de développer un système informatisé permettant aux bibliothèques des institutions universitaires du même Etat de partager leurs ressources et de réduire ainsi leurs coûts de fonctionnement. Les premiers bureaux d'OCLC furent installés dans la bibliothèque centrale de la Ohio State University (OSU), et le OSU Research Center hébergea la première salle informatique d'OCLC. C'est à partir de cette implantation dans le monde universitaire que Frederick G. Kilgour, le premier président d'OCLC, fit passer OCLC d'un système informatique régional à destination de 54 établissements universitaires appartenant au même Etat à un réseau informatique couvrant le monde entier. En 1981, tout en gardant le même sigle, le Ohio College Library Center devint le OCLC Online Computer Library Center.

Une forte proportion des 25.000 bibliothèques participantes est située en Amérique du Nord. Ces bibliothèques appartiennent à des réseaux régionaux regroupant chacun plusieurs états pour les Etats-Unis ou plusieurs provinces pour le Canada. OCLC vise maintenant à développer le nombre de ses adhérents dans d'autres pays et continents. Les bibliothèques adhérentes recoivent les services d'OCLC grâce à OCLC Asie et Pacifique, OCLC Europe, OCLC Amérique Latine et Caraïbes, ou bien par le biais de distributeurs internationaux.

Outre la gestion du OCLC Online Union Catalog, OCLC propose des services tels que le catalogage, la gestion des acquisitions, le contrôle d'autorités, l'envoi de documents suite à une demande de prêt interbibliothèques, la référence en ligne, la recherche spécialisée dans les nouvelles technologies, le microfilmage et la scannérisation des documents. OCLC dispose aussi d'une maison d'édition, Forest Press, et d'une filière commerciale, Information Dimensions. Forest Press publie notamment la Dewey Decimal Classification, classification utilisée dans les bibliothèques publiques pour le classement des documents. Information Dimensions fournit des logiciels de gestion documentaire et éditoriale et des logiciels d'archivage électronique.

OCLC dispose également d'un service appelé NetFirst, qui répertorie, classe, catalogue et indexe les ressources disponibles sur Internet (articles complets, journaux électroniques, lettres d'information, sites gopher et catalogues de bibliothèques) et donne un résumé pour chacune d'elles. Les URL (uniform resource locators) des sites, les adresses électroniques et les forums de discussions sont formatés en liens hypertextes.

A la fois complémentaire et différent du catalogue d'OCLC, le gigantesque catalogue du Research Libraries Information Network (RLIN) comprend 82 millions de notices. Il est géré par le Research Libraries Group (RLG), une association à but non lucratif qui rassemble les organismes souhaitant améliorer l'accès à l'information dans les domaines de l'enseignement et de la recherche.

Des centaines de bibliothèques de recherche, dépôts d'archives, musées, bibliothèques universitaires, bibliothèques publiques, bibliothèques de droit, bibliothèques techniques et bibliothèques d'entreprise utilisent RLIN pour le catalogage, le prêt interbibliothèques et le contrôle des archives et des manuscrits. Catalogue collectif en ligne regroupant les notices de tous les organismes adhérents, RLIN est à la fois un système de recherche documentaire et une base de données internationale d'information bibliographique. 365 langues y sont représentées, et les notices sont également disponibles dans les alphabets des langues JACKPHY (japonais, arabe, chinois, coréen, persan, hébreu et yiddish) et du cyrillique.

RLIN inclut aussi l'English Short Title Catalogue (ESTC) et des fichiers d'autorités.

L'English Short Title Catalogue (ESTC) donne les descriptifs des publications anglaises ou de langue anglaise publiées entre 1473 et 1800. Ce catalogue "contient les notices de tous types de documents publiés en Grande-Bretagne ou dans ses colonies ou publiés en langue anglaise n'importe où dans le monde, et qui vont des oeuvres de Shakespeare et de La Bible du roi Jacques aux ballades et écrits anonymes". Précédemment appelée Eighteenth-Century Short Title Catalogue, la base, qui s'est fortement accrue en 1994 avec l'ajout de 75.000 notices de documents publiés avant 1701, a été rebaptisée English Short Title Catalogue. Ce catalogue d'environ 500.000 notices s'enrichit tous les jours de nouvelles notices provenant principalement de l'ESTC/Amérique du Nord et de la British Library.

Les fichiers d'autorités de RLIN comprennent le thésaurus d'art et d'architecture, le fichier d'autorités des auteurs personnels et collectifs de la Library of Congress et le fichier d'autorités des sujets, constitué des mots-clés et des renvois établis par la Library of Congress.

RLIN est notamment très prisé dans le domaine de l'histoire de l'art. Il rassemble les 65 bibliothèques américaines spécialisées dans les mêmes domaines, y compris des bibliothèques de musées. Le réseau compte 100.000 notices de catalogues d'expositions et 168.500 enregistrements de documents tels que photographies, diapositives, dessins, estampes ou affiches. Il inclut aussi les 110.000 notices de la base bibliographique Scipio, consacrée aux catalogues de ventes. Relié à d'autres bases de données, il permet par exemple de consulter la liste des thèses américaines.


8.4. L'avenir des catalogues en ligne

L'avenir des catalogues en réseau tient à l'harmonisation du format MARC (machine readable catalogue), qui est la norme utilisée pour le stockage et l'échange de notices bibliographiques. Le terme "catalogue" prête ici à confusion puisque le format MARC n'est ni un type de catalogue, ni une méthode de catalogage, mais seulement un ensemble de codes correspondant à chaque partie de la notice bibliographique pour permettre son traitement informatique.

Une vingtaine de versions MARC a vu le jour depuis le début des années soixante-dix: INTERMARC en France, UKMARC au Royaume-Uni, USMARC aux Etats-Unis, CAN/MARC au Canada, etc., correspondant chacune aux pratiques nationales de catalogage. Toutes ces versions posent de nombreux problèmes pour les échanges de données, si bien qu'on a créé UNIMARC pour disposer d'un format intermédiaire international. Les notices dans le format MARC d'origine sont d'abord converties en UNIMARC avant d'être converties à nouveau dans le format MARC de destination.

Dans le monde anglophone, la British Library (qui utilise UKMARC), la Library of Congress (qui utilise USMARC) et la Bibliothèque nationale du Canada (qui utilise CAN/MARC) sont en train d'harmoniser leurs formats MARC nationaux. Un programme de trois ans a été instauré en décembre 1995 pour mettre au point un format MARC commun aux trois bibliothèques.

Parallèlement, dans le contexte du Programme des bibliothèques lancé par l'Union européenne, l'accent a été mis en 1996 sur l'utilisation du format UNIMARC comme format commun d'échange entre tous les formats MARC utilisés par les bibliothèques européennes. Le groupe de travail constitué a étudié aussi les problèmes posés par les différentes polices de caractères, ainsi que la relation entre le format bibliographique et le format du document quand celui-ci sera disponible en ligne.

Certains préconisent l'utilisation de SGML (standard generalized markup language) comme format commun aux notices bibliographiques et aux documents hypertextuels et multimédias correspondants.

Comme la plupart des éditeurs stockent déjà des documents en format SGML, on songe à faire converger MARC et SGML. La Library of Congress a réalisé la DTD (definition of type of document, qui en définit la structure logique) pour le format USMARC, parce qu'elle sera sans doute de plus en plus amenée à vendre des données à la fois en SGML et en USMARC. Une DTD pour le format UNIMARC est également développée dans le cadre d'un projet de l'Union européenne. Dans son mémoire L'accès aux catalogues des bibliothèques par Internet, Thierry Samain mentionne l'adoption du format SGML par certaines bibliothèques pour encoder leurs données bibliographiques. Dans le catalogue collectif belge par exemple, l'utilisation de SGML permet d'ajouter des éléments descriptifs issus du format MARC et d'autres types de formats. Elle permet aussi de faciliter la production du CD-ROM annuel.

Dans Digital Literacy (New York, Wiley, 1997), Paul Gilster se demande si les moteurs de recherche d'Internet seront les catalogues de demain, ce qui n'est guère possible à l'heure actuelle: contrairement au système commun d'indexation propre aux bibliothèques américaines, chaque engin de recherche a sa propre méthode d'indexation, et l'usager doit se familiariser avec elle afin d'en tirer le meilleur parti.

Ceci dit, les remarques que fait Paul Gilster sur les engins de recherche d'Internet sont applicables aussi aux catalogues des bibliothèques vus à l'échelon mondial. Pour indexer leurs documents, un certain nombre de bibliothèques tentent d'harmoniser leurs mots-matière en utilisant par exemple ceux de la Library of Congress dans le monde anglophone ou ceux de RAMEAU (répertoire d'autorités matières encyclopédique et alphabétique unifié) ou de la Bibliothèque nationale du Canada dans le monde francophone. Malgré ces tentatives d'harmonisation, on ne compte pas le nombre de thésaurus utilisés de par le monde. Le meilleur test est une recherche par sujets dans le OCLC Union Library Catalog pour être persuadé du fait que l'absence d'un thésaurus universel est vraiment problématique.

Les bibliothèques auraient un gigantesque effort à fournir pour harmoniser leurs thésaurus ou leurs listes de mots-matière. En Europe, un thésaurus multilingue serait également indispensable, puisque chacun indexe en général ses publications dans sa propre langue. Le travail est titanesque. Puisque les bibliothèques et Internet sont destinés à collaborer étroitement, pourquoi ne pas envisager une liste multilingue commune à partir des meilleurs outils existant dans les deux domaines?

Un autre problème est celui de l'harmonisation des logiciels. En Europe, l'Union européenne a lancé le projet OPAC Network in Europe (ONE), pour un meilleur accès des OPAC (online public access catalogues) et des catalogues nationaux des bibliothèques européennes.

Réalisé entre janvier et décembre 1997, ONE a rassemblé 15 organismes dans 8 pays européens. Son objectif était de produire un logiciel permettant l'interaction entre les logiciels existants, de façon à n'avoir qu'un seul point d'accès par lequel les usagers d'un pays donné puissent se connecter aux catalogues des bibliothèques d'autres pays. Le but était à la fois d'encourager l'interconnexion entre les bibliothèques européennes pour une plus grande coopération et de résoudre les problèmes liés aux divers formats de notices et aux différentes polices de caractères. Le projet était également basé sur l'utilisation de protocoles internationaux comme la norme Z39.50.

Comme c'est eux qui, à terme, permettront l'accès au documents, les catalogues informatiques doivent être aussi parfaits que possible. On peut même rêver à des catalogues communs aux bibliothèques, aux librairies et aux éditeurs. Du fait de la rigueur et du professionnalisme qu'il implique, le catalogage est devenu un métier à part entière. La notice minimale: auteur, titre, éditeur fait maintenant place à une notice plus complexe régie par des normes internationales permettant un meilleur échange de données. Ce n'est d'ailleurs pas un hasard si la réputation d'une bibliothèque s'appuie en partie sur la qualité de son catalogue. Il est sa colonne vertébrale, et le sera de plus en plus avec le développement des cyberbibliothèques.


Chapitre 9: Perspectives
Table des matières


De l'imprimé à Internet
Page d'accueil du Livre 010101
Page d'accueil du NEF


© 1999 Marie Lebert