0. Introduction

Le projet d'informatisation des huit éditions complètes du Dictionnaire de l'Académie française (projet InfoDAF) a été annoncé à l'Institut de France en novembre 1994 (Wooldridge 1998a). Une Base Académie Échantillon, offrant un modèle du projet global – base dictionnairique et bases critiques associées – a été mise en ligne sur Internet dès la même année et n'a cessé de croître depuis. Parallèlement, les deux directeurs du projet, I. Leroy-Turcan et R. Wooldridge, en ont expliqué les buts et les méthodes et présenté quelques résultats dans une série de conférences et d'articles (voir la Bibliographie). Au moment de la rédaction du présent article (septembre 1998), la saisie électronique du texte de quatre des éditions – la première (1694), la cinquième (1798), la sixième (1835) et la huitième (1932-5) – est achevée. Celles de 1694, 1798 et 1835 sont dorénavant interrogeables en ligne, en modes vedettes et plein texte, sur le site Internet du projet ARTFL (Université de Chicago); les éditions de 1694 et de 1835 sont également interrogeables sur le site FreBase (Université de Toronto); celle de 1932-5 devrait être disponible dès 1999. Ces deux modes d'interrogation correspondent aux deux types de lecture qu'on peut faire d'un dictionnaire imprimé et informatisé: le texte voulu par ses auteurs, ouvrage de référence comprenant une série structurée de monographies de mots et de familles de mots énonçant une norme linguistique; et un texte global non structuré contenant un corpus d'occurrences reflétant les usages linguistiques des rédacteurs. Dans les paragraphes qui suivent, nous voulons donner quelques exemples de deux types d'observations rendues possibles ou facilitées par l'ordinateur: appréciation de la cohérence du système déclaré et confrontation du dit (le dictionnaire comme norme) et du fait (le dictionnaire comme corpus d'usages), sans négliger les dimensions implicites du dit et du fait. Ce bref aperçu est extrait d'une analyse de synthèse approfondie et systématique de la version électronique du DAF 1694 [1].

1. Structure du dictionnaire

Reprenant le modèle structural tripartite répandu par les dictionnaires bilingues de Robert Estienne [2], l'Académie l'applique à un recensement synchronique du français. Les trois niveaux de structures sont les suivants: une macrostructure rangeant les mots de base – "mots primitifs" ou "racines" selon les termes de la Préface – par ordre alphabétique; une mésostructure regroupant les dérivés et composés sous leur mot de base en familles étymologiques; et une microstructure accordant à chaque mot un article énumérant ses propriétés lexicales.

Sur le plan typographique, les mots de base, chefs de famille étymologique, sont imprimés en vedettes en grandes capitales au début d'un alinéa initial mis en saillie. Les dérivés et composés sont présentés de la même façon mais en petites capitales comme sous-vedettes. Les alinéas non initiaux d'un article commencent par une mise en retrait. Exemple succinct:

La liste des séquences en capitales en début d'alinéa que nous fournit automatiquement l'ordinateur [3] facilite le repérage des fausses vedettes (dérivés ou composés imprimés en grandes capitales à la suite du mot chef de famille) et des fausses sous-vedettes (mots de base en petites capitales). Par exemple, la fausse vedette EMMANCHER, donnée entre MANCHE et EMMANCHÉ s.v. MAIN (cf. dans la macrostructure: "EMMANCHER, EMMANCHEIER. Voy sous MAIN."); BOUDER donné typographiquement comme sous-vedette de BOUCLIER.

La même liste facilite aussi le repérage des fautes de classement alphabétique des vedettes; par exemple, BESIGUE est placé entre BESACE (renvoi) et BESCHE; BESOGNE entre BESOIN et BESSON – organisation observable dès 1687 pour ces derniers mots; on peut ajouter que les mots besoin et besogne sont traités séparément, puisqu'ils sont mis chacun en vedette dès 1687 alors qu'ils appartiennent à la même famille, besoin n'étant initialement que la variante au masculin de besogne.

On sait que les unités lexicales traitées par le Dictionnaire de l'Académie ne sont pas toutes mises en capitales mais sont souvent imprimées en minuscules italiques. Du point de vue typographique, elles ont alors le statut de sous-adresses. À l'aide de différents outils dont les listes d'indications de catégorie grammaticale, on réunit rapidement un corpus d'exemples illustrant les hésitations des rédacteurs concernant le statut à accorder à une unité. Ainsi, "VOLER. v. act. Ravir" (s.v. VOLER "v. n."), mais "Desborder. v. act." (s.v. DESBORDER "v. n."); "PAR INDIVIS. Façon de parler adverbiale." (s.v. INDIVIS), mais "Par accident, Maniere de parler adverbiale." (s.v. ACCIDENT).

Il est à cet égard intéressant de constater que certaines séquences en italique dans 1694 correspondent à des séquences mises en petites capitales dans 1687 qu'il s'agisse d'une sous-vedette de 1687 réduite à un simple alinéa définitoire dans 1694 (cf. GARDE-BOUTIQUE où le déplacement de l'alinéa consacré à l'expression garde-boutique correspond à une modification du statut linguistique de l'item) ou de sous-vedettes marquées par l'italique et l'alinéa (comme pour LOUP-GAROU et GAUFFRE dont les exemples impliquent soit une dérogation au système des petites capitales soit une polysémie de l'italique) (cf. Leroy-Turcan 1998c: 2.2.2.1 et 2.2.2.2). Un dernier exemple significatif est celui du micro-article FORCE (voir Tableau) pour lequel plusieurs alinéas, avec reprise du mot adresse en petites capitales dans 1687 sont transformés en italique dans 1694, alors que les alinéas déjà en italique dans 1687 sont maintenus tels quels dans 1694 parce qu'ils sont hiérarchiquement fédérés aux petites capitales dans le cas de simples acceptions sémantiques; on peut penser que la double fonction des petites capitales pour la mésostructure et la microstructure a entraîné, pour cette dernière, son remplacement par les italiques: en effet, elles correspondent ici à des sous-sous-vedettes. L'alternative capitales/italiques restera problématique dans toutes les révisions du DAF; certaines éditions privilégieront les capitales, d'autres les italiques (étude en cours).

C'est plus la lecture du texte que la consultation de listes qui révèle le phénomène des faux micro-articles: suites d'alinéas typographiquement subordonnées à la sous-vedette qui les précède. Par exemple, le traitement du mot coq interrompu par les sous-vedettes COQ-FAISANT, COQ D'INDE, DINDON et DINDONNEAU; celui de main dans lequel vient faire irruption le composé MAINMORTABLE (cf. Wooldridge 1998b):

2. Nomenclature

Outre la nomenclature consultable – unités lexicales présentées en vedette, sous-vedette ou sous-adresse, il y a ce qu'on doit appeler la nomenclature cachée: ce sont les mots qui sont donnés par le dictionnaire comme unités lexicales mais pas à leur place structurelle normale. Exemples: "BARBICHE ou BABICHE. s. f. BARBICHON ou BABICHON. s. m. & par contraction BICHE & BICHON." (s.v. BARBE); "CLINCAILLE, ou QUINCAILLE"; "DELINEATION [...] que l'on appelle aussi Ichnographie." (s.v. LIGNE). Aucuns des mots babiche, barbichon, babichon, biche, bichon, quincaille et ichnographie n'est donné ailleurs en adresse; tous sont cachés à des degrés différents.

À la nomenclature présente, consultable ou cachée, il faut encore ajouter celle qui est absente ou virtuelle alors que les mots fonctionnent dans la langue du texte du dictionnaire, sans être traités. Parmi les mots en ve-, on remarque, entre autres, les oublis suivants: vestement (+ vestemens/vestements) s.v. AUBE, CALEÇON, CHAUSSE, CHEMISE (x 2), CORPS, DALMATIQUE, DECHIRER, HABIT, MAIN, MANTE, NUD, ROBE, SURPLIS, TUNIQUE, VESTIR, DEVESTIR, VIE; vertical (+ verticaux) s.v. NADIR, PLAN, POINT, QUATRE; vetilleux s.v. FORMALISTE, LANTERNE.

À l'opposé des mots oubliés, il y a ceux qui sont traités deux fois (nous en avons relevé plus de 170 parmi les seules vedettes et sous-vedettes, sans compter les sous-adresses). Les items doubles sont le résultat de l'un ou de l'autre de deux facteurs intrinsèques: a) l'existence de deux structures de classement (alphabet et étymologie), source de confusions et d'hésitations multiples; b) la variation graphique. Il convient également de tenir compte du fait que la rédaction s'est faite en plusieurs temps sans révision d'ensemble coordonnée et systématique [4]. Un exemple de chaque type: agriculture donné en vedette (AGRICULTURE) à sa place alphabétique (entre AGRESTE et AGRIFFER) et en sous-vedette (AGRICULTURE) s.v. CULTIVER; CIGNE (vedette dans la tranche des mots en CI-) et CYGNE (vedette à CY-).

Le plus souvent on ne peut pas observer directement la dimension diachronique de la rédaction [5], mais pour le mot s'esbaudir on peut avancer l'hypothèse d'une rédaction faite pendant une période à dominante étymologisante et une autre faite à un moment à dominante alphabétique: La pré-édition de 1687 n'a que le second article; l'affiliation baudet -> s'esbaudir relèverait d'une sorte d'étymologie populaire [6]. On peut encore évoquer, comme exemple de travail en micro-diachronie concernant les remaniements de traitement de la nomenclature suite à la révision des filiations étymologiques, les mots GOURMET et GOURMANDER replacés respectivement de 1687 à 1694 sous GOURMAND et GOURMER (cf. Leroy-Turcan 1996b: 3.3.2.1).

Enfin, pour compléter ce premier aperçu sur la nomenclature, on peut signaler ici les principales dérogations aux principes des choix tels qu'ils ont été énoncés, rappelés dans la Préface (en ê verso), qu'il s'agisse des vieux mots, des mots bas, des régionalismes (cf. Leroy-Turcan 1997b) et enfin des termes techniques, en particulier de tout le vocabulaire technique de la grammaire et de la poétique (cf. Leroy-Turcan 1998b et id. « Modalités de repérage » à paraître).

3. Orthographe

Selon la Préface, "L'Académie s'est attachée à l'ancienne Orthographe receuë parmi tous les gens de lettres, parce qu'elle ayde à faire connoistre l'Origine des mots. [...] Et si un mesme mot se trouve escrit dans le Dictionnaire de deux manieres differentes, celle dont il sera escrit en lettres Capitales au commencement de l'Article est la seule que l'Academie approuve." Déclaration de principe souvent difficile à soutenir dans la pratique du texte [7]. Prenons le cas des mots d'origine grecque, qui ont fait l'objet d'une décision de l'Académie signée en janvier 1678 par le secrétaire perpetuel Mézeray (Registres de l'Académie française, t. IV, p. 98 – cf. le texte des "Décisions sur la langue" avec une analyse sur le site de la Base Académie Échantillon): "a esté arresté qu'on osteroit l'y grec de tous les mots à l'exception de y adverbe, Il y a, de cy, cecy, icy, ny, des diphtongues finales comme Roy, loy, j'ay, j'aimay, je formay, j'ordonnay, et les diphtongues au milieu des mots où la diphtongue se rencontre au milieu des mots, comme loyal, voyez, essayez, et des mots qui viennent du grec comme sympathie, physique, Libye, etc."

Regardons le macro-article d'un des mots cités – SYMPATHIE:

Selon le principe énoncé dans la Préface, l'orthographe approuvée pour le verbe serait simpathiser et non celle donnée par les deux exemples; on peut penser le contraire. Le cas n'est pas isolé. On rencontre parmi les adresses du dictionnaire des formes comme ARCHETIPE ou ARCHIPRESBITERAL. On conclura quand même, que c'est un autre principe énoncé dans la Préface – "il faut reconnoistre l'usage pour le Maistre de l'Orthographe" – qui justifie la graphie d'adresses comme CRISTAL ou CACOCHIME.

Un autre problème est posé par les signes diacritiques qui ne se laissent pas toujours imprimer sur les lettres capitales. Nous renvoyons à Wooldridge 1995 pour le cas de QUEUE.

4. Graphie et sémantique: fond/fonds

Autre sujet de discussion parmi les académiciens: les distinctions à faire entre fond et fonds (Registres, t. IV, p. 91; analyse détaillée sur le site de la Base Échantillon). L'article FOND (vedette FOND, sous-vedette FONDS) dit en partie: Le dernier exemple cité – "c'est un homme qui n'a point de fond" – brise la séparation entre fond et fonds établie dans l'article. La distinction devient bien plus difficile à maintenir lorsqu'on passe de la réflexion métalinguistique à l'utilisation du mot ailleurs dans le texte du dictionnaire. À côté du fond d'un tonneau de l'article FOND, on trouve "On appelle, Barre, La piece d'un tonneau qui traverse le fonds par le milieu." (s.v. BARRE). Traiter une matiere à fond s.v. FOND, mais "examiner une affaire à fonds" s.v. EXAMINER; bastir sur le fonds d'autruy, s.v. FONDS, mais "Mur mitoyen, qui se dit d'un mur qui separe la maison, l'heritage de deux particuliers, & qui est basti également sur le fond de l'un & de l'autre, à frais communs." s.v. MITOYEN; un grand fonds de sçavoir et un grand fonds de malice s.v. FONDS, mais "il a un fond de malice" s.v. MALICE et "homme qui a un grand fond de sçavoir" s.v. ESPUISER.

Les variations de l'usage dans le texte du dictionnaire montrent la fragilité des distinctions faites dans la décision et dans l'article FOND/FONDS, distinctions fondées sur des notions sémantico-étymologiques abstraites qui ont à combattre la prononciation concrète unique de fond/fonds.

5. "Super-articles": vent et vin

On peut apprécier le contraste entre le traitement d'un mot dans son article et son emploi ailleurs; on peut aussi combiner toutes les occurrences du mot dans le texte du dictionnaire pour en faire une sorte de "super-article". Par exemple, le vent est chaud, doux, égal, froid, impetueux, mou ou pluvieux s.v. VENT, mais ailleurs il peut être bruslant (s.v. BRUSLANT), furieux (s.v. FURIEUX), gaillard (s.v. GAILLARD), orageux (s.v. ORAGEUX), perçant (s.v. CINGLER, PERÇANT), tempestueux (s.v. TEMPESTUEUX), traversier (s.v. TRAVERSIER), variable (s.v. VARIABLE) ou violent (s.v. VIOLENT) (cf. étude détaillée dans Leroy-Turcan & Wooldridge 1998).

Pour certains mots, notamment parmi les mots sémantiques de haute fréquence (type coeur, esprit, pain, eau), non seulement le nombre d'occurrences est plus élevé ailleurs dans le dictionnaire que dans l'article consacré à chacun de ces termes, mais ces occurrences peuvent dessiner un portrait plus complet du mot que celui offert par l'article de la nomenclature. Le mot vin a 154 occurrences s.v. VIN et 855 ailleurs, dont tous les emplois du pluriel. Le vin de la nomenclature a un goût, il est doux & picquant; ailleurs il a aussi une odeur: il sent la framboise (s.v. FRAMBOISE, SENTIR), il sent la framboise à pleine bouche (s.v. PLEIN), il sent le terroir (s.v. SENTIR, TERROIR). La dimension du vin peut-être la plus intéressante à être traitée ailleurs, ou surtout ailleurs, que s.v. VIN est celle de la sagesse populaire. Citons quelques contextes: "Le vin est ami du coeur." (s.v. AMI); "Prenez un doigt de vin, cela vous ostera le mal de coeur." (s.v. OSTER); "prendre du vin à jeun cela vaut medecine." (s.v. MEDECINE); "On dit prov. & fig. que Le vin est le lait des vieillards." (s.v. LAICT) (cf. étude détaillée dans Wooldridge 1998b).

[Suite] – [Table]


Notes

1. Étude en préparation.

2. Développé par celui-ci dans son Thesaurus latin et par son fils Henri dans le Thesaurus du grec.

3. Dès lors que toutes les distinctions typographiques ont été codées: cf. Leroy-Turcan & Wooldridge 1997.

4. Si l'on prend en compte les quelques remarques consignées dans les Registres sur les difficultés à obtenir des volontaires pour la relecture – "les autres lettres estant demeurées sans estre distribuées [...] Cette distribution a esté ensuite négligée par la pluspart de ceux à qui elle avoit esté faite" (Registres au 2 juillet 1691) –, les consignes en partie aberrantes comme celle de ne rien corriger sans accord de la compagnie à un moment où il fallait être efficace dans les délais les plus brefs – "on changeroit les réviseurs qui n'auroient droit de revoir les feuilles, le plus succinctement qu'il seroit possible, sans y pouvoir faire aucun changement ny aucune correction ou addition notable que par le consentement et de l'advis de toute la compagnie" (Registres au 2 juin 1691) – et enfin le paragraphe de la Préface, fin du feuillet eiij verso, qui dit: "L'Académie auroit souhaité de pouvoir satisfaire plustost l'impatience que le Public a tesmoignée de voir ce Dictionnaire achevé; Mais on comprenda aisément qu'il n'a pas esté en son pouvoir de faire une plus grande diligence, si on fait reflexion sur les divers accidens tant publics que particuliers qui ont traversé les premieres années de son establissement, & sur la maniere dont elle a esté obligée de travailler."; cf. Leroy-Turcan 1996a et 1998b.

5. Il est important de distinguer les deux perspectives intra-textuelle et inter-textuelle, l'inter-textualité minimale du texte de 1694 étant représentée, pour la dimension diachronique de la rédaction, par la pré-édition de 1687; dès lors, c'est d'abord le texte de 1687 puis éventuellement les confrontations avec d'autres documents – registres, Vaugelas, Ménage, Corneille – qui offrent les outils d'analyse adéquats.

6. baudet est plus tardif (attesté au XVIe s. comme dérivé de baud 'lascif') que esbaudir, s'esbaudir (XIe s. formé sur l'adj. baud 'joyeux': cf. Picoche).

7. Cf. les deux exemples détaillés des graphies de feuille et de genouil dans Leroy-Turcan & Wooldridge 1998.