Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
G. Proust, M. Bellot-Antony & G. Demerson, "Des textes aux dictionnaires des XVIe-XVIIe s."

0. Introduction: les objectifs

L'Équipe EQUIL XVI, intégrée récemment dans le C.E.R.H.A.C. (Centre d'Études sur les Réformes, l'Humanisme et l'Âge Classique), membre de l'UPRES-A 5037, travaille depuis une dizaine d'années à la constitution d'une Base de données spécialisée dans les textes du XVIe s. et de la première moitié du XVIIe s., complémentaire de FRANTEXT. Actuellement une centaine de textes, de 1510 à 1610, y sont enregistrés (cf: "D'une base textuelle à un projet de Dictionnaire électronique", à paraitre dans Le Français Préclassique, n° 7).

Cette base avait d'abord un objectif éditorial: éditions d'oeuvres originales, de "fac-(dis)similés", index, concordances... Mais très vite certains membres de l'équipe ont pensé qu'une telle base pouvait aussi être exploitée dans le domaine dictionnairique. Sans avoir l'ambition de constituer un TLF du XVIe s., nous imaginions seulement pouvoir mettre à profit ce stock considérable de mots pour compléter l'étude du lexique de l'époque.

Dans un premier temps, et à titre expérimental, nous avons cherché à comparer l'ensemble de nos index avec la liste des entrées de dictionnaires du temps (Huguet, Nicot 1606) pour en vérifier la pertinence et l'exhaustivité. Cela nous a amenés à enregistrer, et à organiser dans un fichier de type DBase, les définitions des entrées de la lettre A du Huguet (sans les exemples).

À partir de cette première expérience, nous avons été conduits à penser qu'il était également possible -- pour faciliter l'étude des oeuvres -- de relier directement ces textes à des dictionnaires préalablement enregistrés, de manière à fournir, de façon interactive, une analyse morphologique et sémantique de chacun des mots y apparaissant.

L'outil nécessaire à la réalisation de ces deux objectifs était un analyseur morphologique de la langue du XVIe-XVIIe s., intégré dans un logiciel d'analyse textuelle. Cet analyseur devait être capable notamment de résoudre les hétérographes, problème crucial -- les spécialistes le savent -- dans l'adaptation des logiciels d'analyse textuelle à la langue ancienne, en particulier dans les recherches de cooccurrences ou plus simplement dans la réalisation des index. Ce logiciel pouvait aussi être étendu à l'analyse de l'ensemble des phénomènes de flexion et de conjugaison et également à la reconnaissance de la catégorie grammaticale des mots.

À plus long terme, un tel analyseur pourrait rendre d'autres services, ce que nous verrons plus tard; mais revenons aux réalisations présentes, en explicitant succinctement la manière dont cet analyseur a été conçu, puis en donnant quelques exemples de ses possibilités.

[Suite] -- [Retour à la Table des matières]