3.5. Dimensions des ressources inexploitées du Thresor

Pour mesurer l'importance relative du Thresor comme texte susceptible de fournir des articles cachés et des éléments de vocabulaire oublié, on peut essayer de quantifier ses ressources ainsi que celles d'autres dictionnaires de l'époque.

3.5.1. Étendue

Dans la première édition de cette étude des dictionnaires d'Estienne et de Nicot, nous nous sommes servi des méthodes statistiques du sondage par échantillonnage et de l'écart-type pour estimer le nombre de mots de texte français des quatre éditions du Dictionaire françois-latin, du Thresor, de cinq des éditions du Grand dictionaire françois-latin et de six autres dictionnaires à entrées françaises de la fin du XVIe siècle ou du début du XVIIe. [
30] Les résultats de cette opération ont attribué les trois premières places par ordre d'importance décroissante au Thresor (avec 806.570 mots de texte français ± 50.102), à Marquis 1609 (596.736 ± 21.228) et à Monet 1635 (586.080 ± 28.265). L'échantillonnage retenu -- les tranches correspondant aux deux premières pages des lettres A, B, L et T du Thresor -- a exagéré les effectifs, du moins pour le Thresor et vraisemblablement pour Marquis aussi (nous avons corrigé l'estimation du Thresor en étendant l'échantillonnage aux deux premières pages de toutes les lettres de l'alphabet, ce qui a donné un résultat de 716.411 ± 31.409). Depuis la parution de la première édition, le Thresor a été informatisé. Le chiffrage exhaustif fourni par cette version informatisée, qui contient un balisage de l'appartenance linguistique des mots, indique que le Thresor renferme 650.973 mots de texte français, un nombre toujours supérieur à celui de tout autre dictionnaire de son temps.

3.5.2. Densité

Nous avons prospecté en superficie, on doit sonder en profondeur. À l'étendue d'un texte lexicographique répond sa densité. La densité d'un texte s'exprime comme le quotient du nombre de ses mots par le nombre de termes contenus dans une classe d'entrées donnée. Les limites théoriques en sont l'unité (minimum de densité) et l'infini (maximum de densité). Lexique A, contenant deux fois plus de mots de texte et trois fois plus d'entrées que lexique B, sera plus long mais moins dense que celui-ci. Il est évident que plus un dictionnaire est dense, plus il est probable qu'il renferme d'éléments cachés ou non traités.

Nous enquêtons à trois niveaux: d'abord, à celui des formes, ensuite à celui des adresses, et finalement à celui des alinéas. Ces trois classes d'entrées sont choisies et définies en fonction, d'une part, des méthodes lexicographiques du seizième siècle et du debut du dix-septième siècle, et, d'autre part, de la consultabilité d'un texte pour l'utilisateur moderne. Aussi la typographie est-elle un facteur de première importance. Par forme nous entendons toute forme graphiquement distincte quelle que soit la réalité linguistique correspondante; elle doit appartenir à la nomenclature alphabétique ou étymologique [31] et apparaître en début d'alinéa, et, dans le cas des formes marquées (féminins, pluriels, participes, verbes pronominaux) données à la suite d'une autre forme du même paradigme, être autonyme, c'est-à-dire suivie de la métalangue (virgule, point, indication d'appartenance grammaticale, copule, etc.) pour la distinguer des exemples d'emploi. L'adresse comprend la forme telle que nous venons de la définir et lui ajoute toute répétition autonyme. L'alinéa, qui se distingue par le retour à la ligne, peut aller de l'item simple à l'article développé. [32] Comme nous partons, pour mesurer la densité, de ce qui est immédiatement accessible et que l'inventaire des fonctions grammaticales, des locutions et des sens est le plus souvent ou serré à l'intérieur d'un long alinéa ou confondu avec le listage d'exemples d'emploi, nous faisons abstraction ici des aspects fonctionnels, syntagmatiques et sémantiques.

Nous reprenons l'échantillonnage 'ABLT' (tranches correspondant aux deux premières pages des lettres A, B, L et T du Thresor [33]), les noms propres inclus, et nous retenons en plus de Nicot 1606 (N), les répertoires suivants: Estienne 1539 (E1), Estienne 1549 (E2), Thierry 1564 (T), Nicot-Dupuys 1573 (ND), Marquis 1609 (M), Poille 1609 (P), Cotgrave 1611 (C), de Brosses 1614 (dB), Monet 1620 (M1), Monet 1635 (M2). À titre d'exemple, nous donnons ci-dessous l'énumération complète des formes et des adresses du premier échantillon: [34]

Voici maintenant la densité (D), pour l'échantillonnage 'ABLT', des trois classes définies: La densité telle que nous l'avons mesurée peut n'être en partie qu'apparente chez Monet. Là où Estienne et tous ses successeurs sauf Nicot consacrent, en général, un alinéa à chaque item bilingue, Monet a l'habitude de les regrouper, du moins dans l'Abbregé du parallele et dans les premières pages de l'Invantaire. Il les distingue clairement au moyen des caractères différents employés pour le français et pour le latin, et ses items sont ainsi tout aussi facilement repérables que les alinéas du Dictionaire françois-latin. Quoique Nicot (après Estienne) utilise la même différence de caractères pour distinguer les deux langues, les items bilingues qu'il ajoute sont noyés dans la masse d'informations linguistiques et encyclopédiques dont il les entoure.

Si nous acceptons donc les items bilingues de Monet comme équivalents des alinéas des autres dictionnaires consultés, nos chiffres se modifient comme suit: M1, 621 items bilingues, D3 passe à 7,38; M2, 859 items bilingues, D3 > 8,72. Du coup, le nombre de formes monte chez M1 a 150 (D1 > 30,50) et chez M2 a 168 (D1 > 44,61); le nombre d'adresses monte également: chez M1 à 213 (D2 > 21,50), chez M2 à 258 (D2 > 29,05). À titre de comparaison, si nous extrayons des alinéas de Nicot les items bilingues qui s'y trouvent voilés, la densité de celui-ci ne baisse qu'à 14,00 pour un total de 625 items.

Ainsi, le texte du Thresor de la langue françoyse n'est pas seulement plus long, il est aussi plus dense que celui des autres dictionnaires contemporains et offre, en principe, un terrain plus riche au découvreur de mots.

[Suite] -- [Table des matières]