Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
É. Brunet, "Les dictionnaires électroniques des temps modernes"

1. L'Encyclopedia Universalis

Il serait oiseux de reprendre les considérations générales sur l'hypertexte, si en vogue aujourd'hui. Les moyens nouveaux de stockage et de diffusion, qui permettent l'accès direct à n'importe quelle information et son affichage immédiat, offrent à l'utilisateur la liberté interactive de circulation, avec des itinéraires variés et une signalisation précise -- ce que recouvre la notion d'hypertexte. Mais la circulation peut être étroitement canalisée ou largement ouverte, fluide ou encombrée, selon la portée et la commodité des moyens de communication.

La circulation est aisée dans le CD-Universalis, que l'Encyclopedia du même nom vient de lancer dans le public. Pour parcourir un espace considérable (plus de 45 millions de mots répartis en 52000 entrées et 22000 documents), ce dictionnaire encyclopédique -- à la différence des dictionnaires de langue -- se fonde sur un thésaurus hiérarchique qui tend à structurer les connaissances, les domaines et les concepts.

1.1. La première action à mener est de proposer un mot ou une expression dans la ligne du haut de l'écran, et de choisir un mode de recherche, grâce à un menu déroulant où l'item par défaut (index) cache d'autres options (recherche dans l'encyclopédie tout entière, dans les résultats acquis, dans le panier, dans le document ouvert, parmi les sources citées ou les auteurs d'articles).

Figure 1. Choix du type de recherche.

C'est en principe par l'index que commence une consultation. Si la notion revêt un degré de généralité suffisant, on y verra apparaître des retraits et des sous-catégories, comme dans l'exemple 1 relatif à la physique, qui propose 68 entrées dont certaines hiérarchisées (dans la fenêtre supérieure gauche). On peut élargir ou restreindre la portée de la recherche en sollicitant les symboles + ou ¯ qui accompagnent le nombre des entrées retenues. Noter que les entrées sont classées, selon leur importance typographique, les majuscules l'emportant sur les minuscules et les caractères gras sur les maigres.

Dans une seconde étape on choisit dans la liste des entrées, celle qui cerne de plus près l'objet de la recherche (par exemple antimatière). On obtient alors une liste de références, c'est à dire d'articles développés dans l'encyclopédie. Un troisième choix est à faire parmi ces références -- l'article élu prenant place dans la fenêtre principale (par exemple l'électron dans la figure 2).

Figure 2. Choix de l'entrée, puis de l'article de référence.

En trois ou quatre coups de "zoom" on focalise ainsi la recherche sur le texte pertinent, par une procédure qui est analogue à la consultation du fichier matières dans les bibliothèques.

La structure interne de l'article -- si elle est explicitée -- est montrée en haut de l'écran, à droite. Un clic sur un élément de ce sommaire provoque l'affichage du paragraphe correspondant. Mais en dehors de ce sommaire aucune analyse de l'article n'est disponible. Il n'y a rien qui corresponde aux éléments imposés d'un dictionnaire de langue, comme les définitions et les exemples. L'article est alors considéré comme une portion de texte linéaire, que l'on peut lire, sauvegarder ou imprimer. À défaut d'analyse -- impraticable dans le texte intégral -- le logiciel est généreux à l'exportation. Rien n'y limite la copie ou l'impression, sinon les règles morales qui régissent le copyright (dont le rappel discret figure au bas des documents exportés).

1.2. Il n'est pas nécessaire de construire sa recherche aussi précautionneusement, en suivant le fil logique du thésaurus et en ouvrant les portes avec des mots-clés. La recherche directe est possible dans la totalité de l'encyclopédie, sans autre clé que le mot proposé. L'indexation a en effet été réalisée dans le texte intégral sans rien exclure parmi les mots dits pleins. Même les plus fréquents comme homme ou jour peuvent être proposés. Il y aura seulement des limitations à l'affichage, seules étant retenues les 500 premières références (sur les 3690 où le jour pénètre). Mais les premières sont les plus significatives, puisque le classement des documents présentés est déterminé par la fréquence du mot cherché. Ce mot apparaît en couleur dans la fenêtre de l'article et un système de flèches permet de passer instantanément d'une occurrence à l'autre, ou d'un document au suivant ou au précédent, ou d'une étape à l'autre dans le chemin qu'on a parcouru et dont l'historique est soigneusement relevé. Il faut admirer ici la puissance du moteur de recherche et les facilités de navigation dans un corpus pourtant considérable. Admirable est aussi l'économie des moyens: un seul écran est maintenu d'un bout à l'autre de la consultation, avec quatre zones principales occupant les quatre quadrants. Ces plages sont cependant modulables et extensibles, surtout la fenêtre principale, qui en cas de besoin, peut recouvrir toute la surface. L'ergonomie est d'une grande efficacité, les icones de la partie droite ont un graphisme clair et agréable, même si certains peuvent trouver à redire devant la sobriété manifeste de la présentation, et par exemple devant l'étroitesse de la ligne d'état, au haut de l'écran (les flèches y sont si discrètes qu'elles peuvent passer inaperçues).

Figure 3. Recherche dans le texte intégral de l'encyclopédie.

La recherche dans le texte intégral est cependant dangereuse, si l'on n'a rien pour se protéger contre le bruit et le silence. Contre le bruit, c'est à dire les documents non pertinents, il est avantageux d'accroître les contraintes, soit en proposant une expression, soit en utilisant l'un des opérateurs ET (figure 4), SAUF ou PRES. Contre le silence -- c'est à dire un nombre trop restreint de documents -- on a la ressource de l'opérateur OU et aussi la troncature (marquée par le signe * après le radical qu'on veut isoler).

Figure 4. Expression et opérateurs booléens.

1.3. Les recherches sur les auteurs et les sources jouent un rôle assez semblable à celui de la tradition documentaire, à cette réserve près que la liste des auteurs se limite au catalogue des rédacteurs. Par contre les sources mentionnent la bibliographie extérieure, sans fournir autre chose que les références des ouvrages (ici les bibliothèques reprennent l'avantage...). Ce type de recherche peut s'exercer à deux niveaux, soit à l'intérieur d'un document (on dispose aussi d'un choix de corrélats), soit à l'échelle de l'encyclopédie entière, comme dans la figure 5 qui recense toutes les références dont l'origine est à Clermont-Ferrand.

Figure 5. Recherche dans les sources.

Quoique encyclopédique, le CD-Universalis ne cède à aucune des facilités qui ont cours dans le monde du multimédia. On n'y trouve ni image, ni son, ni séquences animées. Et il n'y a rien dans le CD-ROM qui ne soit fidèlement dans la version-papier, sinon un étonnant moteur de recherche apte à parcourir en tous sens un circuit de 24 gros volumes. Un parti-pris, commun au CD-Rom et au dictionnaire-papier, est affirmé en faveur du texte. C'est toujours avec des mots qu'on aborde le référent, jamais avec des illustrations. En cela l'Encyclopedia Universalis se rapproche des dictionnaires de langue.

[Suite] -- [Retour à la Table des matières]