0. Préface de la présente édition de l'Introduction méthodologique

Les considérations méthodologiques de l'introduction de 1985 sont pertinentes pour la saisie d'un texte ancien, voire moderne -- la plupart pour tout texte, toutes pour les dictionnaires --, que la publication des données se fasse sous forme statique (concordance sur microfiches) ou dynamique (base interactive); seuls quelques détails sont spécifiques à la première. Les formules telles que "l'usager de la concordance" sont donc presque toujours à lire "l'usager de la concordance ou de la base interactive". Les modifications qui ont été apportées ici sont signalées par l'emploi des crochets droits.

Si les principes philologiques énoncés ici sur la transcription du texte, la lemmatisation, l'homographie, les variantes et les mots-clefs métalinguistiques gardent toute leur valeur, un regard porté en 1996 sur les procédés que nous avons utilisés au début des années 80 et notre pratique actuelle dans le contexte de bases interrogeables en temps réel sur disque dur ou en ligne nous amène à faire quelques précisions pour le détail.

La possiblité dont on dispose maintenant de chercher la cooccurrence de séquences textuelles rend caduque la nécessité de distinguer deux types d'apostrophe ou de trait d'union fonctionnels (cf. 2.2) ou celle de faire un sort particulier aux mots de haute fréquence (4.2 et 4.3). L'interrogation interactive rend obsolète également la problématique de la lemmatisation (3); l'auteur d'une base n'a plus à prendre une décision -- toujours insatisfaisante -- à cet égard: le pouvoir du regroupement des formes textuelles est passé entre les mains de l'utilisateur, qui opère les choix qui correspondent à ses objectifs. En revanche, les mots-clefs métalinguistiques (5) ont prouvé leur efficacité pour la structuration a posteriori du texte d'un dictionnaire ancien, tout en laissant intact le texte original (voir T.R. Wooldridge & I. Leroy-Turcan, "Metalinguistic Keywords as a Structural Retrieval Tool for Early Dictionaries"; id., "Les Mots-clés métalinguistiques comme outil d'interrogation structurante des dictionnaires anciens"; T.R. Wooldridge, "Bases dictionnairiques, philologiques, culturelles").

1. Préliminaires: le Thresor et la Concordance

Jean Nicot -- conseiller du roi, maître des requêtes, ambassadeur de France au Portugal, ami de la Pléiade et «personnage tres-sçavant», selon le mot de Ronsard -- consacra une bonne partie de son temps pendant le dernier quart du seizième siècle à une révision du Dictionaire françois-latin de Robert Estienne. Le fruit de ses labeurs, le Thresor de la langue françoyse, tant ancienne que moderne, sous-titré Les Commentaires de la langue françoise, qui parut en 1606, est tout à la fois un dictionnaire monolingue, bilingue et multilingue. Les éléments bilingues sont essentiellement ceux que Nicot avait hérités d'Estienne et le Thresor n'est, à cet égard, qu'un lieu de passage menant à la lexicographie français-latin du père Monet au dix-septième siècle. L'apport de Nicot -- ce qui fait du Thresor le summum de la lexicographie française du seizième siècle et la clef du développement de la lexicographie française moderne -- réside dans la construction d'articles détaillant les propriétés des mots: forme, sens, emploi, exemples, histoire, étymologie, synonymie, dérivés, variantes dialectales, cognates en différentes langues, informations encyclopédiques... Cependant, en conséquence d'un manque d'organisation rigoureuse des informations et de la priorité accordée aux commentaires au détriment de la nomenclature, quantité de mots traités ou employés dans les articles -- dont bon nombre sont inconnus des étymologistes modernes ou ne sont attestés par eux qu'à une date postérieure -- ne figurent pas parmi les entrées alphabétiques.

La concordance comporte plusieurs documents. La concordance globale donne tous les mots de texte et rassemble en articles 'méta-dictionnairiques' tous les commentaires sur le mot et tous ses emplois dans le texte; sont créés ainsi des articles plus complets ou des articles nouveaux; est créé en même temps un 'méta-dictionnaire' des termes métalinguistiques du discours lexicographique. Les deux mini-concordances syntagmatiques fournissent, pour les mots français de haute fréquence à fonctionnement syntagmatique intéressant, un mini-contexte facilitant le repérage des locutions prépositives (à, de...), conjonctives (que...) ou adverbiales (par, avec...), et des verbes pronominaux (se). Des listes alphabétique, inverse et de fréquences sont données pour chacune de trois catégories linguistiques, qui sont, par ordre d'importance: mots français, mots latins, autres (grecs, espagnols, italiens, allemands...). Un autre document, le texte source, est le texte du Thresor qui a servi au traitement informatique. L'ensemble des documents constitue un dictionnaire et un index du Thresor et fait fonctionner celui-ci aux niveaux lexical, lexicographique et métalexicographique.

[Retour à la table] -- [Suite]