Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
J.-M. Messiaen, "Réseau lexical et conception d'un dictionnaire électronique"

1. Quelques préalables

Le Centre d'Études Lexicologiques et Lexicographiques des XVIe et XVIIe siècles (CELL) est un groupe de recherche de l'Université Lumière-Lyon2, actuellement fédéré à l'UPRES-A5037. Le CELL, avec le concours essentiel de l'Institut National de la Langue Française (INaLF-CNRS), publie un périodique annuel, Le Français Préclassique (1500-1650),[1] consacré à la langue française préclassique (et jusqu'à ce jour à des études lexicales essentiellement). Le CELL travaille depuis plusieurs années dans la perspective d'une révision du dictionnaire de Huguet, voire de l'élaboration d'un Dictionnaire du Français Préclassique (DFPC), qui prendrait la suite du Dictionnaire du Moyen Français (DMF).[2] L'entreprise lexicographique du DFPC n'est toutefois pas envisageable dans l'immédiat, au moins selon les procédures jusqu'ici utilisées: a) le corpus textuel est en cours de constitution, sur support électronique (base de données FRANTEXT); b) les éditions critiques des textes préclassiques restent loin de l'achèvement, et leur recension, voire la recension des textes existants, souffre de bien des lacunes[3]; c) enfin, la constitution de glossaires pour les textes préclassique nécessitera d'amples révisions, pour leur conférer une pertinence lexicographique[4]. À ces restrictions s'ajoute la nécessité d'une coordination avec les travaux du DMF, pour des nécessités lexicographiques. En effet, la période préclassique (1500-1650) se caractérise par un double mouvement, d'accroissement lexical d'abord, de normalisation ensuite. Un DFPC qui aurait une ambition descriptive (en est-il une autre possible?) devra prendre en compte, pour nombre de lexies, l'évolution diachronique, ce qui suppose d'articuler cette évolution sur la situation initiale au début du XVIe siècle[5], donc sur le terme des travaux du DMF.

Si donc la constitution d'un DFPC paraît improbable à brève échéance, réfléchir à l'élaboration d'une base de données lexicographiques est un complément indispensable aux travaux qui seront par ailleurs menés sur les textes et les glossaires. C'est dans cette perspective que nous avons produit quelques essais de lexicographie, et que nous proposons ici quelques suggestions, de nature pragmatique avant tout, en fonction d'une connaissance de l'informatique qui n'est pas celle d'un spécialiste.

Il apparaît en effet que les développements de l'outil informatique ont considérablement modifié la pratique lexicographique[6]. À ne considérer que l'exemple du TLF, l'informatique a permis la constitution et l'utilisation de fichiers d'une très grande ampleur; ainsi le corpus approchait-il l'exhaustivité[7] et de nouvelles pratiques pouvaient-elles être mises en oeuvre (toutes les possibilités d'études statistiques n'en sont qu'un exemple). À l'occasion du transfert sur l'Internet des contributions au Français Préclassique, en 1997, il nous semble que les récents développements de l'outil informatique autorisent d'autres modifications de la pratique lexicographique, la principale étant la possibilité de s'affranchir des contraintes du «dictionnaire-livre».

La première de ces contraintes a longtemps été celle de l'ordre alphabétique de présentation des «entrées». Les timides tentatives faites pour s'en affranchir ont été limitées parce qu'elles eussent alourdi considérablement le «dictionnaire-livre» et surtout parce qu'elles semblaient aller à l'encontre d'un mode de consultation adapté au support papier. Or le lexicographe est régulièrement gêné par cette contrainte: décrire les acceptions d'un vocable incite à examiner les acceptions d'autres vocables: le «parcours circulaire» auquel le consultant de dictionnaire fut longtemps astreint, et que l'on a justement critiqué (pour d'autres raisons), pourrait bien être le résultat, en partie involontaire, de la perception de relations entre vocables[8]. Or les derniers développements de l'informatique en réseau permettent d'envisager la constitution d'une base de données lexicographiques affranchie des contraintes du «dictionnaire-livre», voire la production d'«objets lexicographiques» fort différents de ceux que nous utilisons encore. En effet, il est d'ores et déjà possible de proposer, à partir de données identiques, plusieurs «produits» (des résultats de requêtes, en général). Mais il est également possible de coordonner des données d'origine diverse, en fonction de «liens» -- généralement prédéfinis, mais évolutifs sur l'Internet --; ainsi, en simplifiant beaucoup, une base de données lexicographiques n'est plus soumise à l'existence physique d'un fichier ou d'un ensemble de fichiers sur une machine, mais à un ensemble de liens entre fichiers, en quelque lieu que se trouvent ces derniers. L'ensemble des données connectées en interrelation devient donc considérable, et accessible sans trop de difficultés, ce qui autorise des perspectives nouvelles en lexicographie, «science et pratique» de la description du lexique, fort consommatrice de données de divers ordres.

Les «pistes de recherche» ou de «réflexion» que nous pourrons proposer auront pour exemple principal le traitement de quelques acceptions de la lexie fable et résultent d'une pratique encore incomplète de l'informatique en réseau, ce dont nous nous excusons par avance.

[Suite] -- [Retour à la Table des matières]


Notes

1. Diffusion: Didier-Érudition, Paris.

2. Conçu et élaboré par l'INaLF-CNRS, sous la direction de Robert Martin.

3. La contribution de M. Crozet, dans le n° 2 du Français Préclassique, et le complément dû à M. Baldinger dans le n° 4 de la même revue, tendent à poser les jalons d'une rubrique bibliographique, qui devrait prochainement s'enrichir de contributions nouvelles et acquérir une plus grande régularité.

4. Voir l'intervention de M. Buridant, lors de la «Table Ronde autour du Huguet» organisée par l'INaLF, le 18 mars 1996 (compte-rendu à paraitre dans Le Français Préclassique, n° 5, 1996).

5. Pour notre étude de feindre (cf. Le Français Préclassique, n° 3), nous avons pu consulter les occurrences de l'équipe du DMF, avec l'aimable coopération de MM. Martin et Stumpf.

6. Ne sera pas envisagée, toutefois, la publication sur CD-Rom: même si elle facilite la consultation, cette publication se fait encore en fonction du «dictionnaire-papier», dont elle n'est fréquemment qu'un avatar.

7. Exhaustivité concomitante à une délimitation préalable du corpus.

8. Le succés commercial des dictionnaires Robert, qui s'affirment analogiques, tient vraisemblablement pour partie à leur prise en compte d'interrelations lexicales hors de l'ordre alphabétique de présentation.