Il est d'usage, dans le monde de l'édition, de parler du nombre de 'mots' que renferme un dictionnaire. Le terme de 'mot', cependant, est, dans ce contexte, ambigu puisqu'il recouvre deux réalites différentes: le mot linguistique et le mot lexicographique. Le lexicographe, pour découper la langue qu'il s'est donnée à décrire, doit résoudre, d'une manière ou d'une autre et suivant son point de vue (historique ou synchronique, par exemple), le problème de la définition de 'l'unité lexicale'; mais une fois son choix arrêté, les termes qu'il traite cessent de fonctionner en langue pour s'imbriquer dans un discours métalinguistique. Ce sont dorénavant des unités lexicographiques. Donc, les mots que compte l'éditeur sont des mots de dictionnaire. Il s'agit évidemment, pour nous aussi, de nous en tenir aux seuls termes que le dictionnaire présente comme des unités de traitement.
Viennent ensuite deux autres questions: puisque les dictionnaires traitent non seulement les 'mots' de la langue, mais aussi les formes fléchies, les syntagmes et les sens, quels types d'unités veut-on retenir et comment peut-on les identifier? Dans le cas des dictionnaires modernes, les questions ont déjà été tranchées par le lexicographe, qui a choisi de mettre certaines formes ou syntagmes en tête d'article et d'autres à l'intérieur de l'article de la forme de base; qui, devant un signifiant à plusieurs signifiés, a opté pour une interprétation d'homonymie ou de polysémie. On n'a plus, en principe, qu'à compter les têtes d'article, imprimées en gras, les adresses. Si le dictionnaire fait des regroupements dérivationnels à l'intérieur du classement alphabétique des formes de base, les adresses sont tantôt des vedettes de macro-article (dans le classement alphabétique), tantôt des sous-vedettes de sous-article (dans le classement secondaire).
Lorsqu'on se tourne vers le pour voir comment se réalise le signalement des adresses, on est amené à constater une présentation extrêmement variée et troublante. Somme d'un dictionnaire de thème français-latin et de quatre rééditions essentiellement francisantes dont les articles sant tantôt bilingues, tantôt monolingues, tantôt mixtes, [351] le Thresor n'a plus de système unique et clair pour le classement des unités qu'il traite. Le plan relativement simple du Dictionaire francoislatin de 1539 a subi maintes transformations, presque toujours partielles. Les en-têtes de 1539 et le double alignement des alinéas de 1539-49 [352] ont été complètement abandonnés. Les fautes de classement alphabétique, la neutralisation des classements alphabétique et dérivationnel, [353] le regroupement des homonymes, [354] celui des courts items bilingues en longs alinéas articulés, [355] la virtualisation des adresses engagées d'Estienne, [356] les indications d'appartenance grammaticale [357] ou de statut syntagmatique, [358] sont tous des phénomènes occasionnels.
Regardons le plan 'relativement simple' de E 1539. Les en-têtes de macro-article énumèrent la vedette et les sous-vedettes (ABSENT, ABSENCE; ABSOULDRE, ABSOULS, ABSOLUTION; ABSTENIR, ABSTINENCE; etc.). Pour la lettre A, qui occupe 48,33 pages, nous comptons 764 adresses de ce type. Retenons les 762 adresses des 48 premières pages et multiplions par le nombre de pages pour A-Z sur 48: 762 x 525/48 = *8334 adresses dans le dictionnaire. [359] Il ne suffit pas, cependant, de s'en tenir aux seuls en-têtes. La comparaison avec le texte des articles révèle mainte contradiction: une sous-vedette dans l'en-tête qui manque au traitement de l'article (ARBREAU s.v. Arbre, AMIABLE s.v. Ami), ou, cas bien plus fréquent, une sous-vedette donnée en adresse dans le corps de l'article qui manque à l'en-tête (ACCORDANT s.v. Accorder, AFFINEUR s.v. Affiner, AMIABLEMENT s.v. Ami, ARGENTER et ARGENTINE s.v. Argent, etc.). [360] À son tour, le texte de l'article introduit d'autres problèmes. Estienne y a l'habitude de mettre les adresses en saillie par rapport aux séquences phraséologiques, exemples d'emploi. Les items ainsi distingués ne sont pas toujours des adresses françaises, pourtant; au contraire, il s'agit souvent d'adresses latines: "Qui abbaye, Latrator" (s.v. Abbay), "Qui appelle & huche, Euocans" (s.v. Appeler), etc. [361] Parfois, le pied-de-mouche sert à signaler, dans le macro-article, les sous-vedettes -- par exemple, ACCOUSTUMÉ et ACCOUSTUMANCE s.v. Accoustumer. Cependant, les pieds-de-mouche ont pour rôle normal d'indiquer différents acceptions ou emplois d'un mot: "¶ Accord & conuenance ... // ¶ Accord, paction, conuention ... // ¶ Accord, composition, appoinctement ... // ¶ N'estre point d'accord & de l'opinion d'ung autre ... // ¶ Tout d'ung accord ... // ¶ Faire accord ..." (s.v. Accord). [362] Ce n'est pas tout. Certains mots ne sont que virtuellement des adresses: agnus castus (s.v. Agneau) et argenterie (s.v. Argent) ne sont ni signalés dans l'en-tête ni par la typographie dans l'article; arbitrage (s.v. Arbitre) doit son existence, dans l'item où il est donné, au mot arbitre: "Chose qui est soubiecte a l'arbitrage de l'arbitre, Arbitrarium". Ces trois mots sont (difficilement) trouvables. Il est possible de conclure dans le cas des deux premiers à une erreur typographique -- ils auraient, dans l'esprit du lexicographe, appartenu à la nomenclature. Quant à arbitrage, il ne s'y trouverait que fortuitement.
Ainsi, il est déjà impossible, dans E 1539, en suivant les conventions typographiques, de ramasser toutes les adresses et seulement les adresses. Chaque édition successive présentera des problèmes nouveaux; un mot appartenant à la nomenclature d'une édition disparaîtra de celle de la suivante, ou vice versa. La suppression des en-têtes simplifie, dans E 1549, le système de repérage. ARGENTER appartient dorénavant sans équivoque à la nomenclature; ARGENTERIE, mis en saillie, est aussi explicitement une adresse. En revanche, ARGENTINE ("herbe") est subordonné à ARGENTIN et n'y est signalé que d'un pied-de-mouche; il doit attendre T 1564 et la suppression du double alignement pour mériter un statut égal à celui de ARGENTIN, ARGENTÉ, ARGENTER, ARGENTEUX, ARGENTIER, ARGENTERIE. Les items en "Qui ..." (cf. paragraphe précédent) cessent, dès 1564, d'être distingués par la typographie des autres séquences phraséologiques. AAGÉ, donné en tête du macro-article AAGE dans E 1539, mais entouré d'exemples d'AAGE dans le texte de l'article, disparaît, dans E 1549, de la nomenclature consultable; l'addition, en fin de macro-article, en 1564, de l'entrée HOMME AAGÉ l'y rétablit. En 1606, il est imprimé en vedette. Le statut des participes varie. L'en-tête fait de ACCOURCI une sous-vedette en 1539; dans E 1549, il n'est qu'un exemple d'emploi du verbe ACCOURCIR ("Oraisons accourcies"). ACCOMPLI, en saillie dans E 1539 et E 1549, n'est plus distingué des emplois verbaux à partir de 1564 ("Tout est accompli"). Nicot, enfin, donne souvent à une forme marquée, exemple auparavant, statut d'adresse: "Abolie. f. C'est mise hors d'vsage" (1573; cf. 1539-64: "Opinions abolies"). [363]
Le traitement, et donc le statut lexicographique, des syntagmes [364] varie beaucoup. Le premier alinéa du dictionnaire de E 1539 est un en-tête-renvoi. Le consulteur est renvoyé, pour le traitement de A CAUSE, A DROICT, A L'ADVENTURE, A LOISIR, A PROPOS, A RAISON et A TORT, à CAUSE, DROICT, ADVENTURE, etc. Dans ces derniers articles, les syntagmes cités n'ont pas nécessairement un statut distinct de celui d'autres entrées non données ailleurs en vedette. Ainsi, s.v. Cause, sont signalés d'un pied-de-mouche: "A cause // Dire la cause // C'est une des choses qui cause crainte // Pour quelle cause? // Sans cause // Auoir cause & occasion // Vne cause & procez". Dans ND 1573, A LOISIR, A PROPOS et A TORT, seuls des syntagmes de E 1539 à rester s.v. A (A CAUSE > A CESTE CAUSE), sont donnés comme exemples d'emploi de A. L'article MAIN est intéressant du point de vue du traitement des syntagmes. Dans le Thresor, on trouve, par exemple:
Un procédé utilisé par Nicot en 1606, qui réduit les dimensions de la nomenclature, du moins typographiquement, est le regroupement des homonymes: [367] BIERE ("coffret") et DE LA BIERE (boisson), vedettes depuis 1539, sont traités en un alinéa dans le Thresor: "BIERE ... Signifie ores ce coffret ... Ores ... signifie cette maniere de boisson ...". L'article-alinéa BAR, "ville" depuis T 1564, renferme, en 1606, l'emploi préfixal de cette forme.
Le chiffre que nous avons donné plus haut pour le nombre d'adresses sous la lettre A de E 1539 comprenait des renvois. Ceux-ci sont de deux sortes: ceux qui signalent dans le classement alphabétique des dérivés, composés ou syntagmes traités dans l'article de la forme de base [368] et ceux qui représentent des variantes. [369] Sont-ils à compter avec les adresses? Comme nous l'avons indiqué plus haut, certaines des unités syntagmatiques n'ont pas, dans l'article de la forme de base, statut d'adresses, mais plutôt de sous-adresses (cf. A LOISIR s.v. A et s.v. Loisir dans E 1539 et ND 1573). En revanche, BEUVERIE est donné deux fois comme adresse (une fois en renvoi dans le classement alphabétique, et encore dans le macro-article BOIRE), si on considère BEUVERIE et BUVERIE (la forme donnée s.v. Boire) comme deux variantes d'une même forme; dans le cas contraire, on compte deux mots.
Il semble donc impossible de déterminer objectivement ce qu'est la nomenclature du Thresor ou des dictionnaires dont il est issu. Ne compter que des têtes de micro-article (ce qui implique la définition préalable de ce dernier) serait éliminer, surtout du Thresor, nombre de mots qui sont pourtant accessibles au consulteur. Pénétrer à l'intérieur des micro-articles serait ouvrir la porte aux interprétations périlleuses. Vouloir chiffrer la nomenclature, c'est vouloir la comparer à celle d'autres dictionnaires, entreprise futile, puisque les autres dictionnaires, antérieurs, contemporains ou postérieurs, ont des buts différents et emploient des méthodes variées. [370] Cotgrave, par exemple, enregistre beaucoup de formes, surtout des variantes. Donc, quand Barré dit "le volume de Cotgrave est presque double de celui de Nicot", [371] il parle du nombre d'adresses typographiques, [372] non du nombre ou du volume des informations, supérieurs chez Nicot. Dupuys, en prétendant que ND 1573 "est augmenté d'un tiers" par rapport à T 1564, [373] et Douceur, en affirmant le Thresor être "REVEV ET AVGMENTÉ ... DE PLVS DE LA MOITIE" relativement à ND 1573, [374] penseraient plutôt au volume physique des augmentations qu'aux adresses ajoutées. [375] On a avancé le chiffre de 20.000 pour le nombre d'items dans la nomenclature du Thresor. [376] Les calculs que fait Smalley pour arriver à ce total sont assez bizarres. Ayant compté elle-même 1925 mots et expressions ("words and expressions") sous la lettre A, elle se sent obligée d'accepter une affirmation, erronée, de Brunot concernant la proportion du dictionnaire occupée par la lettre A: 62 pages sur 666 selon Brunot, ce qui devient chez Smalley 66 pages sur 666! Smalley n'avait qu'à ouvrir le Thresor pour y trouver 62 pages pour la lettre A sur un total de 674, [377] ce qui fait un rapport de presque 1 a 11, et non celui de 1 à 10 qu'elle utilise pour arriver au nombre théorique de 20.000 mots (1925 x 10 = 20.000!). Calcul plus précis, 1925 multiplié par 674/62 donne 20.927. Le nombre de mots ajoutés à la nomenclature sous la lettre A, par rapport a ND 1573, serait, selon Smalley, de l'ordre de 144. [378] La lettre A occupant, dans ND 1573, 69 pages sur 771, le nombre total d'items de nomenclature pour la quatrième édition du Dictionaire françois-latin serait, toujours selon les critères de selection de Smalley, 19.901. On arrive, de façon semblable, à un total de 19.028 mots pour T 1564 et de 15.025 pour E 1549. [379] Ce dernier nombre contraste avec les 13.000 mots que Brandon trouve dans E 1549, [380] chiffre qu'accepte Smalley elle-même. [381] Donc, calculs inexacts et contradictoires faits à partir de critères subjectifs ou peu significatifs.
Un autre chiffrage de la nomenclature du Thresor, dérivé cette fois non d'estimations grossières mais d'un comptage exhaustif fondé sur les critères énoncés dans la présente étude, [382] nous est fourni par l'édition électronique de ce dictionnaire, établie dans les années 1980. [383] Cette base de données contient un total de 18.123 adresses (vedettes et sous-vedettes, mais non sous-adresses).
En fait, le Thresor n'a pas une nomenclature, il en a plusieurs. [384]
[Suite] -- [Table des matières]