Introduction

Trois questions générales sur le balisage articuleront mon propos et, partant de l'expérience Académie, je prendrai mes exemples dans les quatre dictionnaires suivants Le Dictionnaire de l'Académie Françoise (1694 = DAF), le Dictionnaire Etymologique ou origines de la Langue Françoise de Ménage (1694 = DEOLF), le Dictionnaire des Arts et des sciences de Th. Corneille (1694 = DArS), le Dictionnaire Universel François et Latin de Trévoux 1721 (= DUFLT) [1], choisis pour la cohérence interne du corpus qu'ils constituent du point de vue formel et fonctionnel.

- Quel balisage pour répondre à quels objectifs ?

- Balisage fin analytique ou balisage formel minimal ?

- Quelles sont les implications de ces questions méthodologiques en vertu du statut des dictionnaires appréhendés ?

1. Logique du corpus fondamental

Un corpus à la fois complémentaire et contrastif, constitué par les quatre dictionnaires suivants Académie 1694, Ménage 1694, Th. Corneille 1694, Trévoux 1721.

1.1. La chronologie

Les trois premiers dictionnaires ont été publiés la même année, mais les conditions de leur élaboration sont différentes, qu'il s'agisse de leur genèse ou de la distinction entre le travail individuel d'un auteur identifié (Ménage, Thomas Corneille) et la collaboration de plusieurs, dont seuls quelques-uns sont clairement identifiés ou en partie identifiables (cf. par exemple pour le DAF, Thomas Corneille) indépendamment de la connaissance que l'on a des principaux rédacteurs que furent Vaugelas, Mézeray ou Régnier.

Pour le quatrième dictionnaire, la deuxième édition du Dictionnaire Universel François et Latin de Trévoux 1721, qui se réfère souvent aux trois premiers, avec mention explicite ou non des sources, on retrouve la question de la genèse et de l'élaboration d'un texte par plusieurs auteurs, pour une partie des jésuites dont il est difficile de déterminer l'identité précise, avec des enrichissements et des modifications importantes d'une édition à l'autre [2].

1.2. La complémentarité et la continuité des textes constitutifs de ce corpus

On connaît la répartition officielle entre le DAF et le DArS qui devait traiter les termes techniques que ne recensait pas l'Académie, ce qui pose le problème capital de la distinction entre langue commune et langage de spécialité, donc de limites de nomenclature et de discours définitoire, question sur laquelle je reviendrai à propos des marques d'usages relatives aux domaines par opposition aux marques d'usage technique.

Pour le statut du DEOLF de Ménage, on doit reconnaître que, malgré le principe d'opposition à l'Académie exprimé par Ménage [3], les ouvrages sont complémentaires, parfois concurrents, le DEOLF ne pouvant pas être restreint au seul genre du dictionnaire de spécialité consacré à l'étymologie : j'ai déjà montré que le DEOLF fonctionnait aussi en partie comme dictionnaire de langue, Ménage ayant repris dans ce dictionnaire plusieurs fois la question des usages linguistiques et littéraires, en particulier dans la continuité de ses Observations sur la langue française (1672 et 1675-6). D'autre part, pour une partie de la nomenclature marginalisée, par exemple pour les formes de parlers régionaux, et limitée à des termes techniques, le DEOLF est à apprécier à la fois par rapport aux dictionnaires anciens spécialisés, techniques qui constituent ses références et à la fois par rapport à l'ouverture pré-encyclopédique du dictionnaire de Thomas Corneille, lui-même indissociable à plusieurs égards du dictionnaire universel.

Avec le dictionnaire de Trévoux, nous disposons d'un corpus encore plus complexe, puisque ce texte offre un exemple intéressant de polyphonie énonciative réunissant les objectifs, donc les caractéristiques des dictionnaires précédants : on y retrouve en effet, des considérations sur l'usage, qu'il s'agisse du simple marquage ou de discours plus élaborés (cf. l'Académie), des précisions étymologiques (cf. Ménage), une nomenclature très diversifiée avec un discours définitoire souvent très élaboré, de type encyclopédique (cf. Richelet, Furetière et Thomas Corneille), avec différents degrés de discours empruntés qui imposent une analyse systématique de la filiation des sources : par exemple, pour les sources de seconde main, on peut tenter de déterminer l'intermédiaire, auteur de dictionnaire de spécialité ou de dictionnaire technique universel, et parfois vérifier néanmoins la consultation parallèle de la source première.

1.3. La cohérence interne de ce corpus que l'on peut répartir en deux groupes de textes

Se dégagent ainsi deux séries de critères permettant non seulement de définir la logique interne de mon choix de corpus mais surtout de distinguer deux groupes de textes pour fonder notre réflexion sur les objectifs et les implications méthodologiques du balisage adopté pour les versions électroniques de dictionnaires anciens; c'est à partir de ces préalables et en fonction des critères retenus pour définir le statut de ces textes que pourront être énoncées les principales questions concernant les choix de balisage.

De fait, si du point de vue du genre considéré globalement, nos quatre dictionnaires ont chacun un statut, une idendité, dictionnaire général de langue (= DGL), dictionnaire de spécialité (= DS), dictionnaire universel (= DU), même avec les nuances que venons de rappeler, il n'en est pas de même du point de vue formel et fonctionnel. Du point de vue formel, on verra que les moyens sémiotiques mis en œuvre dans le DAF et le DArS sont très proches et que ces deux textes dictionnairiques peuvent être traités du point de vue informatique de la même façon, avec un balisage formel minimal limité à ce qui concerne la typographie et la mise en page ou colonnes, ce qui peut donner accès à toutes les formes de texte, malgré quelques réserves cependant (cf. infra), alors que le DEOLF et le DUFLT, dont les fonctionnements sont plus complexes car plus diversifiés, présentent des difficultés similaires imposant une réflexion plus souple sur les modalités de mise en œuvre d'un complément ou d'un enrichissement du balisage formel minimal, que l'on propose un balisage intermédiaire pré-analytique, un balisage fin analytique ou d'autres solutions relevant de l'hypertextualité.

C'est donc en fonction de ces préalables que peut se formuler la question du choix de balisage minimal ou élaboré selon les objectifs de recherches, pré-définis eux-mêmes en fonction des caractéristiques des textes considérés.

[
Suite] – [Table]


Notes

1. Qui constitueront mon corpus fondamental de référence auquel j'ajouterai à titre complémentaire les références à d'autres dictionnaires, généraux de langue, comme ceux de Richelet et Furetière, spécialisés ou techniques comme ceux de Guillet et Desroches pour le vocabulaire de la marine.

2. Faits étudiés par Chantal Wionet, dans sa thèse de doctorat, à partir du corpus du Basnage; l'étude des rédacteurs du Trévoux sera enrichie par C. Wionet lors du colloque international organisé à Trévoux les 15 et 16 octobre 1999 sur le rayonnement du Dictionnaire universel de Trévoux. Cf. aussi l'article important de M. Le Guern (Le Guern 1983).

3. «Je fais le contraire de Messieurs de l'Académie Françoise. Ils remplissent leur Dictionaire des mots qui sont en usage, & moi je ne mets dans mes Etymologies que ceux qui sont hors d'usage, pour tâcher de faire ensorte qu'ils ne tombent pas dans l'oubli », Menagiana, 1693, p. 11 (texte cité et commenté in I. Leroy-Turcan, Actes du colloque Ménage, Lyon: SIEHLDA, 1995, p. 263; rééd. électronique, 1998, §3.3).