5. Le flou dictionnairique

Un des principes de base du dictionnaire est la récurrence de la microstructure. Si, par exemple, on donne prononciation, catégorie grammaticale et définition(s) pour le mot A, on est normalement tenu de les fournir pour les mots B, C, D, E, etc. Dans les dictionnaires anciens, ce principe était appliqué à des degrés de systématicité variables. Les dictionnaires modernes, compromis de méthode scientifique et de produit commercial à consommation humaine, contiennent eux aussi mainte dérogation à la règle de la récurrence. Par exemple, dans le Petit Robert 1993 (Robert 1993), l'article caryocinèse au lieu de donner une définition renvoie à mitose, où il y a un renvoi à caryocinèse mais pas de définition de ce mot!

Une autre règle appliquée de façon variable dans le même dictionnaire est celle de la distinction, dans la séquence du traitement sémantique du mot, entre définition (matérialisation du sémème) et conditions d'emploi syntagmatique. Comme le dit la préface méthodologique de la 2e édition du Petit Robert:

Dans PR 1977 et PR 1993, le mot juxtaposer reçoit deux définitions assez difficiles à différencier mais éclairées par les exemples: Si la deuxième définition ne pose pas de problème de compréhension et d'application (« juxtaposer les termes d'une série = les poser les uns à côté des autres »), il n'en est pas de même de la première dans laquelle la partie de l'énoncé hors parenthèses contient des éléments qui concernent les conditions d'emploi syntagmatique et non le défini proprement dit (« juxtaposer une chose à une autre = *la poser à côte d'une autre à une autre et sans liaison »).

L'exemple éclairant la définition défectueuse, l'usager humain, avec son esprit d'analyse et de synthèse et ses compétences linguistique, métalinguistique et pragmatique, arrive à s'en sortir. La machine ne pardonne pas ce genre d'à-peu-près (on pourrait multiplier les types et cas d'ambiguïté dictionnairique à l'infini [18]), aussi n'est-il pas surprenant de constater que les dictionnaires électroniques dérivés de dictionnaires imprimés tels que le Robert Électronique et l'OED2 se contentent de délimiter des champs très généraux ou typographiquement marqués [19].

Il y a un autre aspect du flou dictionnairique, plus dommageable celui-ci, où il faut espérer que l'informatique aura comme effet d'éradiquer l'à-peu-près chronique de la tradition lexicographique. Le problème se manifeste de façon particulièrement flagrante dans le traitement sémantique des lexèmes appartenant à un même champ conceptuel; il peut être démontré pour bien des champs et dans presque tout dictionnaire. Nous examinerons ici dans ses grandes lignes le champ onomasiologique du concept 'sac à transporter des livres, cahiers, papiers' dans les dictionnaires Robert, lesquels vantent les mérites de la méthode analogique « fondée sur une vue du lexique comme ensemble structuré » et qui se donne pour tâche de montrer les « relations entre les mots de la langue » [20]. Partons du mot cartable dans PR 1993:

Un cartable serait ainsi une sorte de sacoche à poignée ou à bretelles utilisée uniquement par les écoliers (à l'exclusion donc des étudiants, professeurs, chercheurs, etc.); le mot cartable aurait un grand rapport de sens [21] avec serviette et les régionalismes calepin et carton; dans le syntagme cartable à bretelles, il est en relation avec gibecière. Cependant, une sacoche ne se porterait qu'au moyen d'une courroie: On remarquera que la sacoche (et le cartable) ne serait jamais en similicuir. Passons à serviette: On nous décrit la forme de la serviette; quelle serait celle du cartable? Nous apprenons que calepin, au sens de « cartable » est un belgicisme: En revanche, la localisation régionale de carton, non défini, reste un mystère: Robert 1985 est plus compréhensif au sujet de la matière: Les renvois ne sont pas les mêmes, bien que et PR 1993 et Robert 1985 donnent gibecière (« Cartable d'écolier à bretelles, porté sur l'épaule ou dans le dos. ») et sac (« Serviette, cartable (dans le lang. des écoliers). ») dans la nomenclature. Dans Robert 1985, l'article serviette (cette fois-ci la serviette est avec ou sans poignée -- cf. ci-dessus) tient compte des professeurs: D'après la ponctuation, le lecteur est renvoyé au mot cartable non seulement pour serviette d'écolier mais également pour serviette d'avocat et serviette de professeur.

Les contradictions d'un article à l'autre laissent perplexe le lecteur humain; souhaitons que les lexicographes tirent profit des contrôles de systématisation offerts par la rédaction dictionnairique assistée par ordinateur pour donner une vraie description des structures du lexique.

Conclusion

L'informatique interactive allège le travail du créateur de bases de données, lequel n'a plus qu'à produire un objet déterminé par des critères presque exclusivement objectifs. L'utilisateur de bases de données pose de plus en plus les questions qu'il veut, pouvant ainsi mettre les données informatisées réellement au service de sa propre réflexion, analytique ou synthétique, tâtonnante ou focalisée. Les outils d'investigation se multiplient. Dans le domaine du flou, on peut citer deux programmes du logiciel TACT permettant à l'utilisateur de définir le degré d'exactitude/approximation de la recherche. Simil [22] retrouve toutes les formes textuelles correspondant à la forme et au degré d'équivalence déclarés. Par exemple, « simil flou 100% » ne retrouvera que la forme flou si elle est présente dans le texte; « simil louf 1% » extraira probablement la liste de toutes les formes du texte; la requête « simil flou 50% » (c'est-à-dire un degré de similarité d'au moins 50%) appliquée à ce paragraphe jusqu'au mot suivant produit flou (4 occurrences), louf (1), ou (3), plus (3). Pour le même texte, Anagrams [23] trouve louf comme anagramme complète de foul, et l (l') et ou comme anagrammes partielles; dans Le Chien jaune de Georges Simenon, il rend, entre autres, les anagrammes complètes suivantes: argent gérant, aspirine parisien, crime merci, éviter vérité, poisons poisson, promet trompe.

On conçoit aisément l'utilité de tels auxiliaires de recherche pour le dépistage de variantes formelles (cf. cognoistre ci-dessus) ou d'échos phoniques et graphiques dans un texte poétique, par exemple [24].

[Retour à la table]


Notes

17. Robert 1977: xiv (préface d'Alain Rey). Il n'y a pas de préface méthodologique dans la 3e édition (1993). Cf. aussi Rey 1965.

18. Il s'agit, entre autres, de la polyvalence des types de caractères (italique/romain dans les marques d'usage) et des délimiteurs (parenthèses et crochets), de la polysémie des renvois, de la superposition d'informations multiples dans des séquences elliptiques (type « Gagner quelque chose (moyen de subsistance, récompense), l'acquérir par son travail. » = « gagner + COD de chose désignant un moyen de subsistance ou une récompense signifie 'acquérir par son travail (un moyen de subsistance ou une récompense)' »); voir Wooldridge et al. 1992.

19. Le Robert Électronique distingue Article abrégé, Article détaillé, Étymologie, Citations, Synonymes et analogues, Homonymes et dérivés. L'OED2 sur CD-ROM délimite quatre champs: Vedette, Étymologie, Définitions, Citations. La version en ligne de l'OED2 exploite un système de jalons interrogeables correspondant à une soixantaine de champs marqués typographiquement ou par des mots métalinguistiques clés dans le dictionnaire imprimé (voir Berg 1989); toujours est-il que le champ de la définition reste inanalysé.

20. Robert 1977: xvi; cf. les thesaurus de la tradition anglo-saxonne.

21. Le signe « => suivi d'un mot en gras, présente un mot qui a un grand rapport de sens: 1° avec le mot traité; 2° avec l'exemple qui précède » (PR 1993: xxiii).

22. Simil est dérivé de l'algorithme de reconnaissance structurelle Ratcliff/Obershelp (voir Ratcliff 1988).

23. Lidio Presutti, Université de Toronto.

24. Voir McCarty 1991.