Le corpus et la base Estienne-Nicot
© CHWP 1996
Mon examen des débuts de la lexicographie française, centré sur le
Thresor de la langue françoyse de Jean Nicot (Wooldridge, 1977), m'a
amené à définir un corpus d'étude comprenant le Thresor et les différentes éditions des dictionnaires qui y ont mené
directement:
- les deux premières éditions (bilingues) du Latinæ linguæ
Thesaurus de Robert Estienne;
- les quatre éditions de son Dictionarium latinogallicum;
- les quatre éditions du Dictionaire françois-latin (Estienne 1539,
Estienne 1549, Thierry 1564, Dupuys-Nicot 1573);
- les six éditions du Grand Dictionaire françois-latin (Stoer, Baudoin,
Marquis, Poille, Voultier, de Brosses), prolongement direct du Dictionaire
françois-latin.
- plus le Thresor de la langue françoyse.
Un tableau montre la filiation des dictionnaires du corpus.
Il y a douze ans, j'ai commencé, grâce à des subventions du Conseil de
recherche en sciences humaines du Canada et d'une aide de l'Institut national de la langue
française (CNRS), la constitution d'une base électronique comprenant les ouvrages
clés du corpus:
- le Latinæ linguæ Thesaurus de 1531, la majeure partie du
français duquel ne passe pas dans le Dictionarium;
- la troisième édition -- la plus complète -- du Dictionarium
latinogallicum (DLG);
- le Thresor, qui garde la presque intégralité des quatre
éditions cumulatives du Dictionaire françois-latin (DFL);
- les six éditions du Grand Dictionaire françois-latin
(GDFL).
Pour chaque texte les parties saisies sont les suivantes:
- Thesaurus 1531: le texte français et les adresses latines correspondantes
[base textuelle = 1,20 mégaoctets];
- DLG 1552: les items bilingues [7,80 Mo];
- Thresor 1606: le texte intégral [7,53 Mo];
- GDFL 1593-1628: les additions par rapport au texte source [1,54 Mo].
T.R. Wooldridge, Les Débuts de la lexicographie française, 1ère éd., University of Toronto Press, 1997.