Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
I. Leroy-Turcan, "Intérêt d'une base informatisée pour le Dictionnaire Etymologique ou Origines de la Langue Françoise, 1694, de Gilles Ménage: les modalités de mise en oeuvre"

2. Modalités de saisie des bases de données déjà réalisées

Nous excluons d'emblée la limitation de la base Ménage à une simple saisie au kilomètre[19] pour des raisons inhérentes à la nature du texte saisi, le DEOLF -- texte d'une richesse exubérante, parfois encombrante, ou, à l'inverse, extrêmement lapidaire[20] -- et ce, par rapport aux travaux envisagés sur la base de données; nous partons donc sur le choix raisonné d'une saisie analytique: nous décidons de laisser de côté, dans un premier temps du moins, l'aspect plus commercial d'une saisie continue destinée à créer un CD-Rom[21] pour faciliter l'accès à un plus large public d'un ouvrage peu représenté dans les bibliothèques.

Les différents modèles de saisie des articles du DEOLF que nous avons d'abord réalisés sous forme de fiches pré-analytiques montrent la nécessité pour le chercheur de s'adapter aux formes mouvantes d'un genre en cours de constitution: le DEOLF, tout en présentant des phénomènes récurrents dans l'organisation des articles et, en général, dans l'utilisation de la typographie garde encore des allures de foisonnement désordonné ce qui implique une permanente souplesse de lecture, donc d'analyse, donc d'encodage ou de définition de mots-clés ou séquences-clés métalinguistiques.

2.1. Saisie analytique avec encodage

2.1.1. L'encodage peut rendre compte conjointement des détails formels et de la pluralité fonctionnelle de certains faits et ne conduire en aucun cas à une analyse restrictive ou réductrice: nos exemples donnés en annexe démontrent que la pluralité des interprétations possibles pour un même fait peut être prise en compte dans une saisie analytique (voir Annexe 1: Cadre élémentaire de la préparation des fiches informatisées).

La saisie analytique n'offre pas seulement les avantages matériels d'un décodage d'autant plus rapide que l'encodage aura été sérieusement effectué; elle permet surtout d'offrir différents degrés de lecture, de rendre compte, grâce à une analyse approfondie, des ambiguïtés fonctionnelles de tout ce qui constitue la micro-structure, de l'organisation des articles à la typographie en passant par les significations des variantes graphiques et des choix délibérés de ponctuation. Cette forme de saisie permet de tenir compte de la dimension historique du texte en présentant les preuves de la genèse du texte dictionnairique.

2.1.2. Signalons simplement ici, à titre d'exemple, le rôle des formes latines et grecques, dont on sait que, dans la lignée des dictionnaires bilingues latin-français/français-latin, elles pouvaient être à la fois définitoires et étymologisantes, comme c'est nettement le cas chez Nicot[22]; cette situation est encore bien attestée dans le DEOLF de Ménage[23], et la difficulté de repérage des différents niveaux de discours est souvent indéniable, notamment pour l'exemplification[24].

Faut-il alors se contenter d'un balisage destiné à guider le lecteur ou consultant dans son interprétation du texte ou est-il préférable de simplement définir une liste de mots-clés ou séquences-clés métalinguistiques[25] facilitant l'interrogation du texte et surtout sa compréhension?

2.2. Les mots-clés ou séquences-clés métalinguistiques

La question de l'interrogation ciblée et fondée sur la structure des informations du texte est très délicate. Quelques réflexions sur la définition du mot métalinguistique et sur l'utilisation qu'on peut en faire s'imposent ici.

2.2.1. Définition et usage du mot-clé métalinguistique: il est convenu d'appeler "mot-clé métalinguistique"[26] une forme lemmatique représentant toutes les possibilités d'occurrences textuelles d'un élément linguistique destiné à marquer un champ informationnel: ainsi, figureront sous le lemme FÉMININ tous les allomorphes correspondant à la marque du genre féminin, de la simple abréviation "f." à la forme complète "féminin(e)" en passant par d'autres formes abrégées comme "fém." ou "fémin."[27] En raison du flou structurel[28] propre aux dictionnaires anciens, il était indispensable d'introduire cet outil d'interrogation qui donne accès aux différents champs informationnels, quelle que soit leur place dans l'organisation parfois aléatoire de la microstructure, ce qui est en particulier la situation du dictionnaire de Ménage.

2.2.2. Les séquences-clés métalinguistiques dans le DEOLF: outils d'interrogation, de compréhension et d'interprétation

Cependant , dans le cas du DEOLF de Ménage, il faut encore tenir compte des difficultés liées à la polysémie de certains "mots-clés", ce qui nous conduit à préciser non seulement les modalités d'identification du "mot-clé" métalinguistique, mais aussi celles de sa définition: de fait, tout en gardant le "mot-clé" pour les situations non ambiguës[29] du DEOLF, nous proposons d'y ajouter la notion de "séquence-clé" métalinguistique, qui est à la fois plus large dans sa définition et plus contraignante dans les conditions d'identification, puisque nous introduisons les repères contextuels comme critères pertinents pour l'efficacité de l'outil d'interogation. Ce sont en effet les critères de distribution en contexte qui permettent de désambiguiser le rôle du mot-clé métalinguistique dans un discours donné. Tel est, par exemple, le cas du verbe dire susceptible d'être utilisé par Ménage aussi bien pour une marque d'usage ancien quand, conjugé à l'imparfait, il est associé à l'indéfini on, pour une marque d'usages contemporains concurrents ou restreints à une aire linguistique donnée large ou limitée, quand il est au présent avec un sujet indéfini, singulier collectif ou pluriel "quelques-uns disent" par opposition à "on dit à Paris", "on dit dans les Provinces", ou au contraire avec un sujet impliquant l'instance énonciatrice "nous disons en Anjou" (Ménage était angevin); mais l'expression "on dit" peut également fonctionner comme copule exemplificatrice dans la séquence-clé métalinguistique introduite par "comme quand": "comme quand on dit"[30]; le verbe dire fonctionne aussi comme marque du discours étymologique lorsqu'il est précédé du mot étudié, parfois accompagné de l'adverbe ainsi, et suivi du complément circonstanciel d'origine introduit par la préposition de: "X, ainsi dit de..."; on pourrait encore affiner l'analyse, et donc les critères d'identification de la séquence-clé, en distinguant différents niveaux de discours étymologiques selon que l'étymon est antérieur au français ou non, notamment dans le cas des dérivations et compositions propres au français[31]; ajoutons à cela, l'emploi de dire utilisé pour l'appréciation critique d'une étymologie formulée par un auteur nommé: le verbe dire, ayant comme sujet le nom propre de l'écrivain cité ou critiqué, est généralement à l'imparfait[32] et est suivi, assez souvent, d'une proposition subordonnée conjonctive complétive rapportant les propos[33].

La notion de "séquence-clé" métalinguistique s'impose donc dans tous les cas où le seul "mot-clé" répondrait imparfaitement à son rôle d'outil d'interrogation structurante, ses allomorphes ne suffisant pas à désambiguiser certains fonctionnements: pour reprendre l'exemple du verbe dire, on opposera l'imparfait correspondant à un usage ancien, aux imparfaits inscrits dans le discours étymologique critique. La définition des séquences-clés en vertu de leur fonctionnement implique donc une lecture attentive du texte et conduit aux limites de l'interprétation.

Donc, en vertu des deux principaux types d'interrogation des bases échantillons actuellement opérationnelles du DEOLF, en cours d'informatisation, nous l'avons vu[34], les interrogations ciblées avec la simple option[35] et les interrogations plus larges grâce à l'utilisation de mots-clés ou de séquences-clés métalinguistiques[36], nous pouvons garantir au consultant des résultats d'interrogation sur ordinateur plus fiables: en ayant comme objectif premier la neutralisation des risques d'erreurs dues à la polysémie des copules fonctionnelles, des mots-clés métalinguistiques, nous préférons, grâce à une analyse systématique des différents contextes d'occurrence des formes définir les multiples variantes contextuelles susceptibles d'orienter le rôle du mot/séquence et donc son interprétation sur le plan sémiotique et fonctionnel: ainsi, pour une même base verbale, la séquence-clé prendra en compte, non seulement la forme des désinences, mais aussi leur valeur (cf. la valeur stylistique implicite de l'imparfait), le groupe sujet, les modalisateurs, les compléments, chaque variable correspondant à une fonction spécifique (copule exemplificatrice, copule étymologisante, copule d'exégèse critique, etc.): par exemple, plutôt que d'isoler un mot clé opinion, qui réunirait les synonymes avis, remarque, etc., nous définissons, en nous fondant sur les contextes préalablement étudiés, plusieurs séquences-clés avec un noyau lexical identique, nominal ou verbal ou les deux conjointement: ainsi pour opinion indissociable d'un verbe qui oriente sa valeur comme pour suivre/approuver/confirmer l'opinion de X (ou mon opinion) , ou contester/critiquer/improuver l'opinion de X/ mon opinion, etc.; il est donc indispensable d'introduire pour les dictionnaires de Ménage[37] la notion de séquences-clés métalinguistiques à côté de celle de mot, dont nous ne remettons pas en cause la pertinence mais dont l'utilisation nécessite des précautions en contexte.

2.3. De fait, grâce à une étude détaillée du DEOLF considéré comme un texte à part entière, nous avons pu déterminer différents niveaux de significations fondés sur des détails, formels et stylistiques: tous ces niveaux de significations doivent être transmis par le spécialiste au consultant des bases de données. Il faut donc que la saisie puisse en rendre compte et c'est pour cette raison que nous proposons d'offrir la complémentarité des deux formules, la saisie analytique avec encodage et les listes de mots-clés enrichis, selon les cas, de séquences-clés métalinguistiques. On gardera notamment l'encodage systématique pour toutes les variantes de vedettes[38] (cf. par exemple les significations des vedettes étendues selon les différentes modalités d'extension), pour la typographie et la ponctuation[39], alors que pour les variantes distributionnelles des formes indéfinies[40] et de copules complexes nous proposerons, outre le balisage ou encodage préalable, les définitions de séquences-clés métalinguistiques.

[Suite] -- [Retour à la Table des matières]


Notes

19. Même si, pour des raisons pratiques, le premier état de saise réalisé par des dactylos est kilométrique, la saisie destinée aux utilisateurs des bases sera nécessairement retravaillée par les chercheurs: à ce stade nous rejetons pour le DEOLF de Ménage la simple base kilométrique avec un balisage limité à la matérialité formelle du dictionnaire (majuscules, alinéas, typographie...).

20. Certains articles se limitent à un étymon sans aucun autre commentaire (cf. pour cette coexistence paradoxale d'articles à visée encyclopédique et inversement d'articles lapidaires ou même inexistants, notre étude sur le vocabulaire des végétaux); le cas d'articles limités à l'étymon est plus fréquent dans la fin du DEOLF que Ménage n'avait pu terminer; on sait qu'il avait relu les feuillets imprimés jusqu'à la lettre S quand il est mort en juillet 1692 (cf. Leroy-Turcan 1991).

21. Nous savons tous qu'il ne s'agit là que d'un aspect superficiel, puisque inhérent aux autres modalités de travail; cela ne peut donc, dans notre perspective, constituer une fin en soi. Quoi qu'il en soit, tout travail d'enrichissement de la base pourra toujours faire l'objet d'un hypertexte (cf. 3).

22. Il serait, à ce titre, particulièrement intéressant d'étudier les étymologies implicites d'Estienne et Nicot à la lumière des critiques formulées par Ménage qui interprète parfois de simples traductions latines de Nicot, déjà données par Estienne, comme des énoncés d'étymons, comme s.v. APENTIS ou ARCELER (analyse comparative Nicot/Ménage en cours sur le corpus AGINOR).

23. Cf. Leroy-Turcan 1991: 193 sqq.

24. Ainsi quand l'exemple-citation fonctionne pour confirmer un sens (ou des variations), il est parfois difficile d'établir l'articulation entre l'exemple et la définition: l'exemple qui participe à la définition du mot concerné en contribuant à la mise en place des critères permettant l'analyse sémantique a bien une fonction heuristique. L'exemple peut tenir lieu de définition, comme s.v. NUESSE (1650: "Comme quand on dit fief, Iusticier, suiet en nuesse (ce que vous trouverez souvent dans les Coustumes d'Anjou et du Maine)..."), article pour lequel Ménage a supprimé dans le DEOLF de 1694, la formulation vous trouverez pour présenter sans mot d'introduction particulier une citation de la Coutume d'Anjou, article 29; il est clair qu'entre les deux éditions il a pris le temps de revérifier l'occurrence et fait le choix d'un exemple définitoire. D'autre part les exemples concernant l'étymologie ne se limitent pas toujours à l'attestation des formes liées à l'étymon et l'étymologie exemplifiée offre, au-delà de l'étymon, une sorte de tremplin vers un discours encyclopédique, rayonnement culturel de l'exemplification étymologique. Une étude approfondie des différents niveaux d'exemplification montre à quel point Ménage s'attachait à décrire et exemplifier les différentes phases d'existence d'une langue en perpétuelle évolution: par des exemples choisis dans différentes synchronies, Ménage a transmis des perspectives diachroniques et ses exemples-citations reflétant une synchronie démultipliée, elle-même héritière d'états impliquant la notion de synchronie "épaisse". Il est donc capital de reconnaître à ces différents niveaux d'usage, à la fois attestés et exemplifiés par le DEOLF, le statut de témoignages de synchronies définies inscrites dans la diachronie. L'exemple prouve le fonctionnement du DEOLF comme dictionnaire de langue puisqu'il révèle certains des conflits entre les usages.

25. Cf. Leroy-Turcan & Wooldridge 1995b; cf. sur Internet, les listes de mots-clés établies pour la base de données réunissant les huit éditions du Dictionnaire de l'Académie française.

26. Wooldridge à paraître.

27. Cf. Leroy-Turcan & Wooldridge 1995b: introduction.

28. Wooldridge 1993.

29. De fait, la notion de mot reste pertinente pour tous les cas relevant de la banalité du dictionnaire: ainsi pour les mots-clés métalinguistiques indicateurs de sources comme écrire, dériver, confirmer, interpreter, etc.

30. Cf. s.v. ISSUES: "Comme quand on dit, ventes et issûes."

31. Sans négliger non plus les cas où s'ajoute la justification d'un étymon déjà mentionné.

32. Imparfait, qui, outre sa valeur temporelle de passé d'antériorité logique par rapport au discours critique du présent dictionnaire, peut marquer à lui seul le désaccord implicite de Ménage avec l'étymologie rapportée, et ce, en vertu d'habitudes linguistiques de Ménage que nous avons déjà décrites ailleurs (Leroy-Turcan 1991 et 1995b).

33. L'ensemble peut être ou non suivi d'une critique et d'une argumentation.

34. Cf. Leroy-Turcan 1994a et ici, notes 9 à 15, pour les bases déjà réalisées; cf. enfin base à paraître sur Internet.

35. Recherche des noms d'auteurs ou des titres d'ouvrages susceptibles d'être cités par Ménage.

36. Interrogation portant par exemple sur les verbes discursifs utilisés par Ménage pour introduire, dans son propre discours, celui des auteurs de références cités ou sur l'emploi des verbes concernant les différents niveaux de références bibliographiques, notamment les exégèses de sources nommées dont Ménage souligne la filiation des emprunts, comme pour prendre et tirer.

37. Les OrLF (1650), le DEOLF (1694) et les OLI (1669 et 1685) sont remarquables par leur irrégularité dans l'expression et les variables parfois plus fantaisistes que scientifiques.

38. Cf. l'importance des vedettes étendues qui nous conduisent à introduire d'autres perspectives touchant à la fois l'historique des textes du dictionnaire et le fonctionnement interne du dictionnaire étudié ou consulté.

39. Notre étude sur les notes manuscrites de Ménage sur l'exemplaire des OrLF conservé à la BN (Rés. X. 923) nous permet de confirmer l'attention particulière que Ménage a accordée aux corrections sur la typographie (l'italique de l'imprimé correspond systématiquement à un texte souligné dans les notes manuscrites, même quand il s'agit de longues citations) et même sur la ponctuation (cf. Leroy-Turcan 1991: 69-113).

40. Signalons simplement ici l'utilisation en 1650 dans les OrLF de formes telles que quelques-uns, plusieurs, certains anihilées dans 1694 par la mention détaillée des sources auparavant évoquées de façon allusive: cf. sur la question générale de l'indéfini dans le dictionnaire, Leroy-Turcan & Wooldridge 1994.