0. Introduction
Le projet d'informatisation des huit éditions complètes du Dictionnaire de l'Académie française (projet InfoDAF) a été annoncé à l'Institut de France en novembre 1994 (Wooldridge 1998a). Une Base Académie Échantillon, offrant un modèle du projet global base dictionnairique et bases critiques associées a été mise en ligne sur Internet dès la même année et n'a cessé de croître depuis. Parallèlement, les deux directeurs du projet, I.
Leroy-Turcan et R. Wooldridge, en ont expliqué les buts et les méthodes et présenté quelques résultats dans une série de conférences et d'articles (voir la Bibliographie). Au moment de la rédaction du présent article (septembre 1998), la saisie électronique du texte de quatre des éditions la première (1694), la cinquième (1798), la sixième (1835) et la huitième (1932-5) est achevée. Celles de 1694, 1798 et 1835 sont dorénavant interrogeables en ligne, en modes vedettes et plein texte, sur le site Internet du projet ARTFL (Université de Chicago); les éditions de 1694 et de 1835 sont également interrogeables sur le site FreBase (Université de Toronto); celle de 1932-5 devrait être disponible dès 1999. Ces deux modes d'interrogation correspondent aux deux types de lecture qu'on peut faire d'un dictionnaire imprimé et informatisé: le texte voulu par ses auteurs, ouvrage de référence comprenant une série structurée de monographies de mots et de familles de mots énonçant une norme linguistique; et un texte global non structuré contenant un corpus d'occurrences reflétant les usages linguistiques des rédacteurs. Dans les paragraphes qui suivent, nous voulons donner quelques exemples de deux types d'observations rendues possibles ou facilitées par l'ordinateur: appréciation de la cohérence du système déclaré et confrontation du dit (le dictionnaire comme norme) et du fait (le dictionnaire comme corpus d'usages), sans négliger les
dimensions implicites du dit et du fait. Ce bref aperçu est extrait d'une analyse de synthèse approfondie et systématique de la version électronique du DAF 1694 [1].
1. Structure du dictionnaire
Reprenant le modèle structural tripartite répandu par les dictionnaires bilingues de Robert
Estienne [2], l'Académie l'applique à un recensement synchronique du français. Les trois niveaux de structures sont les suivants: une macrostructure rangeant les mots de base "mots primitifs" ou "racines" selon les termes de la Préface par ordre alphabétique; une mésostructure regroupant les dérivés et composés sous leur mot de base en familles étymologiques; et une microstructure accordant à chaque mot un article énumérant ses propriétés lexicales.
Sur le plan typographique, les mots de base, chefs de famille étymologique, sont imprimés en vedettes en grandes capitales au début d'un alinéa initial mis en saillie. Les dérivés et composés sont présentés de la même façon mais en petites capitales comme sous-vedettes. Les alinéas non initiaux d'un article commencent par une mise en retrait. Exemple succinct:
APOSEME
[...]
APOSTAT. s. m. Celuy qui a quitté la vraye Re-
ligion. Julien l'Apostat.
Il se dit aussi d'un Moine qui renonce à ses
voeux & à son habit. C'est un apostat, un Moine
apostat.
APOSTASIE. s. f. Desertion de la vraye foy, ou
d'un Ordre Religieux. Il est tombé dans l'apostasie.
il est revenu de son apostasie.
APOSTASIER. v. n. Se faire apostat. Apostasier de
la foy. les mauvais traitements que l'on faisoit à ce Re-
ligieux l'ont fait apostasier.
APOSTER [...]
La liste des séquences en capitales en début d'alinéa que nous fournit automatiquement l'ordinateur [3] facilite le repérage des fausses vedettes (dérivés ou composés imprimés en grandes capitales à la suite du mot chef de famille) et des fausses sous-vedettes (mots de base en petites capitales). Par exemple, la fausse vedette EMMANCHER, donnée entre MANCHE et EMMANCHÉ s.v. MAIN (cf. dans la macrostructure: "EMMANCHER, EMMANCHEIER. Voy sous MAIN."); BOUDER donné typographiquement comme sous-vedette de BOUCLIER.
La même liste facilite aussi le repérage des fautes de classement alphabétique des vedettes; par exemple, BESIGUE est placé entre BESACE (renvoi) et BESCHE; BESOGNE entre BESOIN et BESSON organisation observable dès 1687 pour ces derniers mots; on peut
ajouter que les mots besoin et besogne sont traités
séparément, puisqu'ils sont mis chacun en vedette dès
1687 alors qu'ils appartiennent à la même famille,
besoin n'étant initialement que la variante au masculin de
besogne.
On sait que les unités lexicales traitées par le Dictionnaire de l'Académie ne sont pas toutes mises en capitales mais sont souvent imprimées en minuscules italiques. Du point de vue typographique, elles ont alors le statut de sous-adresses. À l'aide de différents outils dont les listes d'indications de catégorie grammaticale, on réunit rapidement un corpus d'exemples illustrant les hésitations des rédacteurs concernant le statut à accorder à une unité. Ainsi, "VOLER. v. act. Ravir" (s.v. VOLER "v. n."), mais "Desborder. v. act." (s.v. DESBORDER "v. n."); "PAR INDIVIS. Façon de parler adverbiale." (s.v. INDIVIS), mais "Par accident, Maniere de parler adverbiale." (s.v. ACCIDENT).
Il est à cet égard intéressant de constater
que certaines séquences en italique dans 1694 correspondent à
des séquences mises en petites capitales dans 1687 qu'il s'agisse
d'une sous-vedette de 1687 réduite à un simple alinéa
définitoire dans 1694 (cf. GARDE-BOUTIQUE où le
déplacement de l'alinéa consacré à l'expression
garde-boutique correspond à une modification du statut
linguistique de l'item) ou
de sous-vedettes marquées par l'italique et l'alinéa (comme
pour LOUP-GAROU et GAUFFRE dont les exemples impliquent soit une
dérogation au système des petites capitales soit une
polysémie de l'italique) (cf. Leroy-Turcan 1998c: 2.2.2.1 et 2.2.2.2). Un dernier exemple significatif est celui du micro-article FORCE (voir Tableau) pour
lequel plusieurs alinéas, avec reprise du mot adresse en petites
capitales dans 1687 sont transformés en italique dans 1694, alors
que les alinéas déjà en italique dans 1687 sont
maintenus tels quels dans 1694 parce qu'ils sont hiérarchiquement
fédérés aux petites capitales dans le cas de simples
acceptions sémantiques; on peut penser que la double fonction des
petites capitales pour la mésostructure et la microstructure a
entraîné, pour cette dernière, son remplacement par
les italiques: en effet, elles correspondent ici à des
sous-sous-vedettes. L'alternative capitales/italiques restera problématique dans toutes les révisions du DAF; certaines éditions privilégieront les capitales, d'autres les italiques (étude en cours).
C'est plus la lecture du texte que la consultation de listes qui révèle le phénomène des faux micro-articles: suites d'alinéas typographiquement subordonnées à la sous-vedette qui les précède. Par exemple, le traitement du mot coq interrompu par les sous-vedettes COQ-FAISANT, COQ D'INDE, DINDON et DINDONNEAU; celui de main dans lequel vient faire irruption le composé MAINMORTABLE (cf. Wooldridge 1998b):
COQ. s. m. [...]
Coq de bois, ou coq de bruyere, [...]
COQ-FAISANT. s. m. Le masle du Faisant.
COQ-D'INDE. [...]
DINDON. s. m. Diminutif de coq-d'Inde [...]
DINDONNEAU. Diminutif de Dindon.
On appelle en style burlesque, Dindonniere, [...]
On appelle par derision, Plumes de coq, [...]
On dit fig. d'Un homme à qui par quelque esmo-
tion subite le sang monte au visage, qu'Il est rouge
comme un coq.
[...]
2. Nomenclature
Outre la nomenclature consultable unités lexicales présentées en vedette, sous-vedette ou sous-adresse, il y a ce qu'on doit appeler la nomenclature cachée: ce sont les mots qui sont donnés par le dictionnaire comme unités lexicales mais pas à leur place structurelle normale. Exemples: "BARBICHE ou BABICHE. s. f. BARBICHON ou BABICHON. s. m. & par contraction BICHE & BICHON." (s.v. BARBE); "CLINCAILLE, ou QUINCAILLE"; "DELINEATION [...] que l'on appelle aussi Ichnographie." (s.v. LIGNE). Aucuns des mots babiche, barbichon, babichon, biche, bichon, quincaille et ichnographie n'est donné ailleurs en adresse; tous sont cachés à des degrés différents.
À la nomenclature présente, consultable ou cachée, il faut encore ajouter celle qui est absente ou virtuelle alors que les mots fonctionnent dans la
langue du texte du dictionnaire, sans être traités. Parmi les mots en ve-, on remarque, entre autres, les oublis suivants: vestement (+ vestemens/vestements) s.v. AUBE, CALEÇON, CHAUSSE, CHEMISE (x 2), CORPS, DALMATIQUE, DECHIRER, HABIT, MAIN, MANTE, NUD, ROBE, SURPLIS, TUNIQUE, VESTIR, DEVESTIR, VIE; vertical (+ verticaux) s.v. NADIR, PLAN, POINT, QUATRE; vetilleux s.v. FORMALISTE, LANTERNE.
À l'opposé des mots oubliés, il y a ceux qui sont traités deux fois (nous en avons relevé plus de 170 parmi les seules vedettes et sous-vedettes, sans compter les sous-adresses). Les items doubles sont le résultat de l'un ou de l'autre de deux facteurs intrinsèques: a) l'existence de deux structures de classement (alphabet et étymologie), source de confusions et d'hésitations multiples; b) la variation graphique. Il convient également de tenir compte du fait que la rédaction s'est faite en plusieurs temps sans révision d'ensemble coordonnée et systématique [4]. Un exemple de chaque type: agriculture donné en vedette (AGRICULTURE) à sa place alphabétique (entre AGRESTE et AGRIFFER) et en sous-vedette (AGRICULTURE) s.v. CULTIVER; CIGNE (vedette dans la tranche des mots en CI-) et CYGNE (vedette à CY-).
AGRICULTURE. s. f. L'Art de cultiver la terre,
& de la rendre fertile. Le premier de tous les Arts,
c'est l'agriculture. sçavoir bien l'agriculture. s'adonner
à l'agriculture. des livres d'agriculture.
AGRICULTURE. s. f. L'art de cultiver la terre. Cet
homme aime l'agriculture, entend bien l'agriculture.
traitté d'agriculture.
CIGNE ou CYGNE. s. m. Oiseau aquatique dont
le col est fort long & le plumage fort blanc. Escrire
avec une plume de cigne. porter une peau de cigne sur
l'estomac.
On dit, d'Un homme dont les cheveux sont tout
blancs, qu'Il est blanc comme un cigne.
Il se dit fig. d'un Poëte: & en ce sens on appelle
Virgile, Le Cygne de Mantoüe.
CYGNE. s. m. Gros oiseau aquatique, de pluma-
ge blanc, & qui a le col extremement long. Toute
cette riviere estoit couverte de cygnes. Plume de cygne.
le duvet d'un cygne. peau de cygne.
On dit, d'Un homme qui a la barbe & les che-
veux tout blancs, qu'Il est blanc comme un cygne.
Le plus souvent on ne peut pas observer directement la dimension diachronique de la rédaction [5], mais pour le mot s'esbaudir on peut avancer l'hypothèse d'une rédaction faite pendant une période à dominante étymologisante et une autre faite à un moment à dominante alphabétique:
S'ESBAUDIR. v. n. p. Se resjoüir autant que fait un
baudet qui se donne du plaisir en se frottant & se
roulant dans un pré. Cet homme s'esbaudit tant qu'il
peut. il s'est esbaudi dans une telle compagnie. Il est
vieux, & se dit encore en plaisantant. (s.v. BAUDET)
ESBAUDIR, S'ESBAUDIR. v. n. p. Se resjoüir
avec excés, & tesmoigner sa joye en dansant, sau-
tant ou de quelqu'autre maniere semblable. Il est
bas, & ne s'employe qu'en raillerie.
La pré-édition de 1687 n'a que le second article; l'affiliation baudet -> s'esbaudir relèverait d'une sorte d'étymologie populaire [6]. On peut encore évoquer, comme exemple de travail en
micro-diachronie concernant les remaniements de traitement de la
nomenclature suite à la révision des filiations
étymologiques, les mots GOURMET et GOURMANDER replacés
respectivement de 1687 à 1694 sous GOURMAND et GOURMER (cf. Leroy-Turcan 1996b: 3.3.2.1).
Enfin, pour compléter ce premier aperçu sur la nomenclature, on peut
signaler ici les principales dérogations aux principes des choix tels qu'ils ont
été énoncés, rappelés dans la Préface (en ê verso), qu'il s'agisse des vieux
mots, des mots bas, des régionalismes (cf. Leroy-Turcan 1997b) et enfin des
termes techniques, en particulier de tout le vocabulaire technique de la
grammaire et de la poétique (cf. Leroy-Turcan 1998b et id. « Modalités de repérage » à paraître).
3. Orthographe
Selon la Préface, "L'Académie s'est attachée à l'ancienne Orthographe receuë parmi tous les gens de lettres, parce qu'elle ayde à faire connoistre l'Origine des mots. [...] Et si un mesme mot se trouve escrit dans le Dictionnaire de deux manieres differentes, celle dont il sera escrit en lettres Capitales au commencement de l'Article est la seule que l'Academie approuve." Déclaration de principe souvent difficile à soutenir dans la pratique du texte [7]. Prenons le cas des mots d'origine grecque, qui ont fait l'objet d'une décision de l'Académie signée en janvier 1678 par le secrétaire perpetuel Mézeray (Registres de l'Académie française, t. IV, p. 98 cf. le texte des "Décisions sur la langue" avec une analyse sur le site de la Base Académie Échantillon): "a esté arresté qu'on osteroit l'y grec de tous les mots à l'exception de y adverbe, Il y a, de cy, cecy, icy, ny, des diphtongues finales comme Roy, loy, j'ay, j'aimay, je formay, j'ordonnay, et les diphtongues au milieu des mots où la diphtongue se rencontre au milieu des mots, comme loyal, voyez, essayez, et des mots qui viennent du grec comme sympathie, physique, Libye, etc."
Regardons le macro-article d'un des mots cités SYMPATHIE:
SYMPATHIE. s. f. [...]
SYMPATHIQUE. adj. de t. g. [...]
SIMPATHISER. v. n. Avoir de la sympathie. Nos
humeurs ne sympathisent pas ensemble. il est difficile
de trouver deux hommes qui sympathisent entierement.
Selon le principe énoncé dans la Préface, l'orthographe approuvée pour le verbe serait simpathiser et non celle donnée par les deux exemples; on peut penser le contraire. Le cas n'est pas isolé. On rencontre parmi les adresses du dictionnaire des formes comme ARCHETIPE ou ARCHIPRESBITERAL. On conclura quand même, que c'est un autre principe énoncé dans la Préface "il faut reconnoistre l'usage pour le Maistre de l'Orthographe" qui justifie la graphie d'adresses comme CRISTAL ou CACOCHIME.
Un autre problème est posé par les signes diacritiques qui ne se laissent pas toujours imprimer sur les lettres capitales. Nous renvoyons à Wooldridge 1995 pour le cas de QUEUE.
4. Graphie et sémantique: fond/fonds
Autre sujet de discussion parmi les académiciens: les distinctions à faire entre fond et fonds (Registres, t. IV, p. 91; analyse détaillée sur le site de la Base Échantillon). L'article FOND (vedette FOND, sous-vedette FONDS) dit en partie:
FOND. s. m. L'endroit le plus bas d'une chose creu-
se. Le fond d'un puits. le fond d'un tonneau. [...]
[...]
A fond. adverb. En allant jusqu'au fond. En pe-
netrant jusqu'au fond. Traiter une matiere à fond.
il possede cette science à fond. il nous en a entretenus
à fond.
[...]
FONDS. s. m. Le sol d'une terre, d'un champ, d'un
heritage. Estre riche en fonds de terre. cultiver un
fonds, un bon fonds, un mauvais fonds. bastir sur son
fonds. il ne faut pas bastir sur le fonds d'autruy.
[...]
Fonds, se dit fig. De l'esprit, des moeurs, du
sçavoir, de la capacité d'un homme, C'est un
homme qui a un grand fonds d'esprit. beaucoup de
fonds d'esprit. cela marque un grand fonds de sçavoir.
un grand fonds d'erudition. cela part d'un grand
fonds de probité. cela ne peut venir que d'un grand
fonds de malice. un fonds inépuisable de science. c'est
un homme qui n'a point de fond.
Le dernier exemple cité "c'est un homme qui n'a point de fond" brise la séparation entre fond et fonds établie dans l'article. La distinction devient bien plus difficile à maintenir lorsqu'on passe de la réflexion métalinguistique à l'utilisation du mot ailleurs dans le texte du dictionnaire. À côté du fond d'un tonneau de l'article FOND, on trouve "On appelle, Barre, La piece d'un tonneau qui traverse le fonds par le milieu." (s.v. BARRE). Traiter une matiere à fond s.v. FOND, mais "examiner une affaire à fonds" s.v. EXAMINER; bastir sur le fonds d'autruy, s.v. FONDS, mais "Mur mitoyen, qui se dit d'un mur qui separe la maison, l'heritage de deux particuliers, & qui est basti également sur le fond de l'un & de l'autre, à frais communs." s.v. MITOYEN; un grand fonds de sçavoir et un grand fonds de malice s.v. FONDS, mais "il a un fond de malice" s.v. MALICE et "homme qui a un grand fond de sçavoir" s.v. ESPUISER.
Les variations de l'usage dans le texte du dictionnaire montrent la fragilité des distinctions faites dans la décision et dans l'article FOND/FONDS, distinctions fondées sur des notions sémantico-étymologiques abstraites qui ont à combattre la prononciation concrète unique de fond/fonds.
5. "Super-articles": vent et vin
On peut apprécier le contraste entre le traitement d'un mot dans son article et son emploi ailleurs; on peut aussi combiner toutes les occurrences du mot dans le texte du dictionnaire pour en faire une sorte de "super-article". Par exemple, le vent est chaud, doux, égal, froid, impetueux, mou ou pluvieux s.v. VENT, mais ailleurs il peut être bruslant (s.v. BRUSLANT), furieux (s.v. FURIEUX), gaillard (s.v. GAILLARD), orageux (s.v. ORAGEUX), perçant (s.v. CINGLER, PERÇANT), tempestueux (s.v. TEMPESTUEUX), traversier (s.v. TRAVERSIER), variable (s.v. VARIABLE) ou violent (s.v. VIOLENT) (cf. étude détaillée dans Leroy-Turcan & Wooldridge 1998).
Pour certains mots, notamment parmi les mots sémantiques de haute fréquence (type coeur, esprit, pain, eau), non seulement le nombre d'occurrences est plus élevé ailleurs dans le dictionnaire que dans l'article consacré à chacun de ces termes, mais ces occurrences peuvent dessiner un portrait plus complet du mot que celui offert par l'article de la nomenclature. Le mot vin a 154 occurrences s.v. VIN et 855 ailleurs, dont tous les emplois du pluriel. Le vin de la nomenclature a un goût, il est doux & picquant; ailleurs il a aussi une odeur: il sent la framboise (s.v. FRAMBOISE, SENTIR), il sent la framboise à pleine bouche (s.v. PLEIN), il sent le terroir (s.v. SENTIR, TERROIR). La dimension du vin peut-être la plus intéressante à être traitée ailleurs, ou surtout ailleurs, que s.v. VIN est celle de la sagesse populaire. Citons quelques contextes: "Le vin est ami du coeur." (s.v. AMI); "Prenez un doigt de vin, cela vous ostera le mal de coeur." (s.v. OSTER); "prendre du vin à jeun cela vaut medecine." (s.v. MEDECINE); "On dit prov. & fig. que Le vin est le lait des vieillards." (s.v. LAICT) (cf. étude détaillée dans Wooldridge 1998b).
[Suite] [Table]
Notes
1. Étude en préparation.
2. Développé par celui-ci dans son Thesaurus latin et par son fils Henri dans le Thesaurus du grec.
3. Dès lors que toutes les distinctions typographiques ont été codées: cf. Leroy-Turcan & Wooldridge 1997.
4. Si l'on prend en compte les quelques remarques consignées dans les Registres sur les difficultés à obtenir des volontaires pour la relecture "les autres lettres estant demeurées sans estre distribuées [...] Cette distribution a esté ensuite négligée par la pluspart de ceux à qui elle avoit esté faite" (Registres au 2 juillet 1691) , les consignes en partie aberrantes comme celle de ne rien corriger sans accord de
la compagnie à un moment où il fallait être efficace dans les délais les plus brefs "on changeroit les réviseurs qui n'auroient droit de revoir les
feuilles, le plus succinctement qu'il seroit possible, sans y pouvoir faire aucun
changement ny aucune correction ou addition notable que par le consentement et de
l'advis de toute la compagnie" (Registres au 2 juin 1691) et enfin le paragraphe de
la Préface, fin du feuillet eiij verso, qui dit: "L'Académie auroit souhaité de pouvoir satisfaire plustost l'impatience que le Public a tesmoignée de voir ce Dictionnaire achevé;
Mais on comprenda aisément qu'il n'a pas esté en son pouvoir de faire une plus grande diligence, si on fait reflexion sur les divers
accidens tant publics que particuliers qui ont traversé les premieres années de son establissement, & sur la maniere dont elle a esté
obligée de travailler."; cf. Leroy-Turcan 1996a et 1998b.
5. Il est important de distinguer les deux perspectives intra-textuelle et inter-textuelle, l'inter-textualité minimale du texte de 1694 étant représentée, pour la dimension diachronique de la rédaction, par la pré-édition de 1687; dès lors, c'est d'abord le texte de 1687 puis éventuellement les confrontations avec d'autres documents registres, Vaugelas, Ménage, Corneille qui offrent les outils d'analyse adéquats.
6. baudet est plus tardif (attesté au XVIe s. comme dérivé de baud 'lascif') que esbaudir, s'esbaudir (XIe s. formé sur l'adj. baud 'joyeux': cf. Picoche).
7. Cf. les deux exemples détaillés des graphies de feuille et de genouil dans Leroy-Turcan & Wooldridge 1998.