Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.", Clermont-Ferrand, 14-15 juin 1996 | I. Leroy-Turcan, "Intérêt d'une base informatisée pour le Dictionnaire Etymologique ou Origines de la Langue Françoise, 1694, de Gilles Ménage: les modalités de mise en oeuvre" |
Les différents modèles de saisie des articles du DEOLF que nous avons d'abord réalisés sous forme de fiches pré-analytiques montrent la nécessité pour le chercheur de s'adapter aux formes mouvantes d'un genre en cours de constitution: le DEOLF, tout en présentant des phénomènes récurrents dans l'organisation des articles et, en général, dans l'utilisation de la typographie garde encore des allures de foisonnement désordonné ce qui implique une permanente souplesse de lecture, donc d'analyse, donc d'encodage ou de définition de mots-clés ou séquences-clés métalinguistiques.
2.1. Saisie analytique avec encodage
2.1.1. L'encodage peut rendre compte conjointement des détails formels et de la pluralité fonctionnelle de certains faits et ne conduire en aucun cas à une analyse restrictive ou réductrice: nos exemples donnés en annexe démontrent que la pluralité des interprétations possibles pour un même fait peut être prise en compte dans une saisie analytique (voir Annexe 1: Cadre élémentaire de la préparation des fiches informatisées).
La saisie analytique n'offre pas seulement les avantages matériels d'un décodage d'autant plus rapide que l'encodage aura été sérieusement effectué; elle permet surtout d'offrir différents degrés de lecture, de rendre compte, grâce à une analyse approfondie, des ambiguïtés fonctionnelles de tout ce qui constitue la micro-structure, de l'organisation des articles à la typographie en passant par les significations des variantes graphiques et des choix délibérés de ponctuation. Cette forme de saisie permet de tenir compte de la dimension historique du texte en présentant les preuves de la genèse du texte dictionnairique.
2.1.2. Signalons simplement ici, à titre d'exemple, le rôle des formes latines et grecques, dont on sait que, dans la lignée des dictionnaires bilingues latin-français/français-latin, elles pouvaient être à la fois définitoires et étymologisantes, comme c'est nettement le cas chez Nicot[22]; cette situation est encore bien attestée dans le DEOLF de Ménage[23], et la difficulté de repérage des différents niveaux de discours est souvent indéniable, notamment pour l'exemplification[24].
Faut-il alors se contenter d'un balisage destiné à guider le lecteur ou consultant dans son interprétation du texte ou est-il préférable de simplement définir une liste de mots-clés ou séquences-clés métalinguistiques[25] facilitant l'interrogation du texte et surtout sa compréhension?
2.2. Les mots-clés ou séquences-clés métalinguistiques
La question de l'interrogation ciblée et fondée sur la structure des informations du texte est très délicate. Quelques réflexions sur la définition du mot métalinguistique et sur l'utilisation qu'on peut en faire s'imposent ici.
2.2.1. Définition et usage du mot-clé métalinguistique: il est convenu d'appeler "mot-clé métalinguistique"[26] une forme lemmatique représentant toutes les possibilités d'occurrences textuelles d'un élément linguistique destiné à marquer un champ informationnel: ainsi, figureront sous le lemme FÉMININ tous les allomorphes correspondant à la marque du genre féminin, de la simple abréviation "f." à la forme complète "féminin(e)" en passant par d'autres formes abrégées comme "fém." ou "fémin."[27] En raison du flou structurel[28] propre aux dictionnaires anciens, il était indispensable d'introduire cet outil d'interrogation qui donne accès aux différents champs informationnels, quelle que soit leur place dans l'organisation parfois aléatoire de la microstructure, ce qui est en particulier la situation du dictionnaire de Ménage.
2.2.2. Les séquences-clés métalinguistiques dans le DEOLF: outils d'interrogation, de compréhension et d'interprétation
Cependant , dans le cas du DEOLF de Ménage, il faut encore tenir compte des difficultés liées à la polysémie de certains "mots-clés", ce qui nous conduit à préciser non seulement les modalités d'identification du "mot-clé" métalinguistique, mais aussi celles de sa définition: de fait, tout en gardant le "mot-clé" pour les situations non ambiguës[29] du DEOLF, nous proposons d'y ajouter la notion de "séquence-clé" métalinguistique, qui est à la fois plus large dans sa définition et plus contraignante dans les conditions d'identification, puisque nous introduisons les repères contextuels comme critères pertinents pour l'efficacité de l'outil d'interogation. Ce sont en effet les critères de distribution en contexte qui permettent de désambiguiser le rôle du mot-clé métalinguistique dans un discours donné. Tel est, par exemple, le cas du verbe dire susceptible d'être utilisé par Ménage aussi bien pour une marque d'usage ancien quand, conjugé à l'imparfait, il est associé à l'indéfini on, pour une marque d'usages contemporains concurrents ou restreints à une aire linguistique donnée large ou limitée, quand il est au présent avec un sujet indéfini, singulier collectif ou pluriel "quelques-uns disent" par opposition à "on dit à Paris", "on dit dans les Provinces", ou au contraire avec un sujet impliquant l'instance énonciatrice "nous disons en Anjou" (Ménage était angevin); mais l'expression "on dit" peut également fonctionner comme copule exemplificatrice dans la séquence-clé métalinguistique introduite par "comme quand": "comme quand on dit"[30]; le verbe dire fonctionne aussi comme marque du discours étymologique lorsqu'il est précédé du mot étudié, parfois accompagné de l'adverbe ainsi, et suivi du complément circonstanciel d'origine introduit par la préposition de: "X, ainsi dit de..."; on pourrait encore affiner l'analyse, et donc les critères d'identification de la séquence-clé, en distinguant différents niveaux de discours étymologiques selon que l'étymon est antérieur au français ou non, notamment dans le cas des dérivations et compositions propres au français[31]; ajoutons à cela, l'emploi de dire utilisé pour l'appréciation critique d'une étymologie formulée par un auteur nommé: le verbe dire, ayant comme sujet le nom propre de l'écrivain cité ou critiqué, est généralement à l'imparfait[32] et est suivi, assez souvent, d'une proposition subordonnée conjonctive complétive rapportant les propos[33].
La notion de "séquence-clé" métalinguistique s'impose donc dans tous les cas où le seul "mot-clé" répondrait imparfaitement à son rôle d'outil d'interrogation structurante, ses allomorphes ne suffisant pas à désambiguiser certains fonctionnements: pour reprendre l'exemple du verbe dire, on opposera l'imparfait correspondant à un usage ancien, aux imparfaits inscrits dans le discours étymologique critique. La définition des séquences-clés en vertu de leur fonctionnement implique donc une lecture attentive du texte et conduit aux limites de l'interprétation.
Donc, en vertu des deux principaux types d'interrogation des bases échantillons actuellement opérationnelles du DEOLF, en cours d'informatisation, nous l'avons vu[34], les interrogations ciblées avec la simple option[35] et les interrogations plus larges grâce à l'utilisation de mots-clés ou de séquences-clés métalinguistiques[36], nous pouvons garantir au consultant des résultats d'interrogation sur ordinateur plus fiables: en ayant comme objectif premier la neutralisation des risques d'erreurs dues à la polysémie des copules fonctionnelles, des mots-clés métalinguistiques, nous préférons, grâce à une analyse systématique des différents contextes d'occurrence des formes définir les multiples variantes contextuelles susceptibles d'orienter le rôle du mot/séquence et donc son interprétation sur le plan sémiotique et fonctionnel: ainsi, pour une même base verbale, la séquence-clé prendra en compte, non seulement la forme des désinences, mais aussi leur valeur (cf. la valeur stylistique implicite de l'imparfait), le groupe sujet, les modalisateurs, les compléments, chaque variable correspondant à une fonction spécifique (copule exemplificatrice, copule étymologisante, copule d'exégèse critique, etc.): par exemple, plutôt que d'isoler un mot clé opinion, qui réunirait les synonymes avis, remarque, etc., nous définissons, en nous fondant sur les contextes préalablement étudiés, plusieurs séquences-clés avec un noyau lexical identique, nominal ou verbal ou les deux conjointement: ainsi pour opinion indissociable d'un verbe qui oriente sa valeur comme pour suivre/approuver/confirmer l'opinion de X (ou mon opinion) , ou contester/critiquer/improuver l'opinion de X/ mon opinion, etc.; il est donc indispensable d'introduire pour les dictionnaires de Ménage[37] la notion de séquences-clés métalinguistiques à côté de celle de mot, dont nous ne remettons pas en cause la pertinence mais dont l'utilisation nécessite des précautions en contexte.
2.3. De fait, grâce à une étude détaillée du DEOLF considéré comme un texte à part entière, nous avons pu déterminer différents niveaux de significations fondés sur des détails, formels et stylistiques: tous ces niveaux de significations doivent être transmis par le spécialiste au consultant des bases de données. Il faut donc que la saisie puisse en rendre compte et c'est pour cette raison que nous proposons d'offrir la complémentarité des deux formules, la saisie analytique avec encodage et les listes de mots-clés enrichis, selon les cas, de séquences-clés métalinguistiques. On gardera notamment l'encodage systématique pour toutes les variantes de vedettes[38] (cf. par exemple les significations des vedettes étendues selon les différentes modalités d'extension), pour la typographie et la ponctuation[39], alors que pour les variantes distributionnelles des formes indéfinies[40] et de copules complexes nous proposerons, outre le balisage ou encodage préalable, les définitions de séquences-clés métalinguistiques.
[Suite] -- [Retour à la Table des matières]
Notes
19. Même si, pour des raisons pratiques, le premier état de saise
réalisé par des dactylos est kilométrique, la saisie
destinée aux utilisateurs des bases sera nécessairement
retravaillée par les chercheurs: à ce stade nous rejetons pour
le DEOLF de Ménage la simple base kilométrique avec un
balisage limité à la matérialité formelle du
dictionnaire (majuscules, alinéas, typographie...).
20. Certains articles se limitent à un étymon sans aucun autre
commentaire (cf. pour cette coexistence paradoxale d'articles à
visée encyclopédique et inversement d'articles lapidaires ou
même inexistants, notre étude sur le vocabulaire des
végétaux); le cas d'articles limités à
l'étymon est plus fréquent dans la fin du DEOLF que
Ménage n'avait pu terminer; on sait qu'il avait relu les feuillets
imprimés jusqu'à la lettre S quand il est mort en juillet 1692
(cf. Leroy-Turcan 1991).
21. Nous savons tous qu'il ne s'agit là que d'un aspect superficiel,
puisque inhérent aux autres modalités de travail; cela ne peut
donc, dans notre perspective, constituer une fin en soi. Quoi qu'il en soit,
tout travail d'enrichissement de la base pourra toujours faire l'objet d'un
hypertexte (cf. 3).
22. Il serait, à ce titre, particulièrement intéressant
d'étudier les étymologies implicites d'Estienne et Nicot
à la lumière des critiques formulées par Ménage
qui interprète parfois de simples traductions latines de Nicot,
déjà données par Estienne, comme des
énoncés d'étymons, comme s.v. APENTIS ou ARCELER (analyse
comparative Nicot/Ménage en cours sur le corpus AGINOR).
23. Cf. Leroy-Turcan 1991: 193 sqq.
24. Ainsi quand l'exemple-citation fonctionne pour confirmer un sens (ou des
variations), il est parfois difficile d'établir l'articulation entre
l'exemple et la définition: l'exemple qui participe à la
définition du mot concerné en contribuant à la mise en
place des critères permettant l'analyse sémantique a bien une
fonction heuristique. L'exemple peut tenir lieu de définition, comme
s.v. NUESSE (1650: "Comme quand on dit fief, Iusticier, suiet en
nuesse (ce que vous trouverez souvent dans les Coustumes d'Anjou et du
Maine)..."), article pour lequel Ménage a supprimé dans le
DEOLF de 1694, la formulation vous trouverez pour
présenter sans mot d'introduction particulier une citation de la
Coutume d'Anjou, article 29; il est clair qu'entre les deux éditions il
a pris le temps de revérifier l'occurrence et fait le choix d'un
exemple définitoire. D'autre part les exemples concernant
l'étymologie ne se limitent pas toujours à l'attestation des
formes liées à l'étymon et l'étymologie
exemplifiée offre, au-delà de l'étymon, une sorte de
tremplin vers un discours encyclopédique, rayonnement culturel de
l'exemplification étymologique. Une étude approfondie des
différents niveaux d'exemplification montre à quel point
Ménage s'attachait à décrire et exemplifier les
différentes phases d'existence d'une langue en perpétuelle
évolution: par des exemples choisis dans différentes
synchronies, Ménage a transmis des perspectives diachroniques et ses
exemples-citations reflétant une synchronie démultipliée,
elle-même héritière d'états impliquant la notion de
synchronie "épaisse". Il est donc capital de reconnaître à
ces différents niveaux d'usage, à la fois attestés et
exemplifiés par le DEOLF, le statut de témoignages de
synchronies définies inscrites dans la diachronie. L'exemple prouve le
fonctionnement du DEOLF comme dictionnaire de langue puisqu'il
révèle certains des conflits entre les usages.
25. Cf. Leroy-Turcan & Wooldridge 1995b; cf. sur Internet, les listes de
mots-clés établies pour la base de données
réunissant les huit éditions du Dictionnaire de
l'Académie française.
27. Cf. Leroy-Turcan & Wooldridge 1995b: introduction.
29. De fait, la notion de mot reste pertinente pour tous les cas
relevant de la banalité du dictionnaire: ainsi pour les
mots-clés métalinguistiques indicateurs de sources comme
écrire, dériver, confirmer,
interpreter, etc.
30. Cf. s.v. ISSUES: "Comme quand on dit, ventes et issûes."
31. Sans négliger non plus les cas où s'ajoute la justification
d'un étymon déjà mentionné.
32. Imparfait, qui, outre sa valeur temporelle de passé
d'antériorité logique par rapport au discours critique du
présent dictionnaire, peut marquer à lui seul le
désaccord implicite de Ménage avec l'étymologie
rapportée, et ce, en vertu d'habitudes linguistiques de Ménage
que nous avons déjà décrites ailleurs (Leroy-Turcan 1991
et 1995b).
33. L'ensemble peut être ou non suivi d'une critique et d'une
argumentation.
34. Cf. Leroy-Turcan 1994a et ici, notes 9 à 15, pour les bases
déjà réalisées; cf. enfin base à
paraître sur Internet.
35. Recherche des noms d'auteurs ou des titres d'ouvrages susceptibles
d'être cités par Ménage.
36. Interrogation portant par exemple sur les verbes discursifs
utilisés par Ménage pour introduire, dans son propre discours,
celui des auteurs de références cités ou sur l'emploi des
verbes concernant les différents niveaux de références
bibliographiques, notamment les exégèses de sources
nommées dont Ménage souligne la filiation des emprunts, comme
pour prendre et tirer.
37. Les OrLF (1650), le DEOLF (1694) et les OLI (1669 et
1685) sont remarquables par leur irrégularité dans l'expression
et les variables parfois plus fantaisistes que scientifiques.
38. Cf. l'importance des vedettes étendues qui nous conduisent à
introduire d'autres perspectives touchant à la fois l'historique des
textes du dictionnaire et le fonctionnement interne du dictionnaire
étudié ou consulté.
39. Notre étude sur les notes manuscrites de Ménage sur
l'exemplaire des OrLF conservé à la BN (Rés. X.
923) nous permet de confirmer l'attention particulière que
Ménage a accordée aux corrections sur la typographie (l'italique
de l'imprimé correspond systématiquement à un texte
souligné dans les notes manuscrites, même quand il s'agit de
longues citations) et même sur la ponctuation (cf. Leroy-Turcan 1991:
69-113).
40. Signalons simplement ici l'utilisation en 1650 dans les OrLF de
formes telles que quelques-uns, plusieurs, certains
anihilées dans 1694 par la mention détaillée des sources
auparavant évoquées de façon allusive: cf. sur la
question générale de l'indéfini dans le dictionnaire,
Leroy-Turcan & Wooldridge 1994.