Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
K. Cameron, "De la concordance au dictionnaire"

Pour clore ce tour d'horizon, j'aimerais citer les exemples du programme de morphologie. On peut entrer n'importe quelle phrase qui sera analysée automatiquement. Cette analyse est pourtant purement mécanique et ne montre aucun signe d'intelligence. Si on entre 'tu l'as vue', on reçoit l'analyse suivante:

chaque terme peut avoir au moins deux analyses grammaticales -- il en est ainsi pour il me la porte, où la peut être un pronom ou un article et porte peut être inclus dans six catégories. Je ne voudrais pas donner l'impression de dédaigner les efforts de ceux qui ont mis au point les programmes que j'ai cités, car, bien au contraire, je les admire. Ils ont su faire face à beaucoup d'obstacles et ont réussi à mettre au point des dictionnaires qui fournissent une aide précieuse. Il me semble pourtant que si les Journées 'Dictionnaires électroniques' ont eu lieu c'est parce que nous croyons pouvoir, et devoir, toujours chercher des moyens d'améliorer et de perfectionner ces outils de travail. Je pourrais tout aussi bien indiquer des erreurs et des faiblesses dans les concordances que j'ai préparées moi-même.

Ne tournons pas plus longtemps autour du pot. Il est évident que l'équipe de Clermont-Ferrand travaille depuis au moins deux ans sur une affaire intéressante. Elle est en train de rendre accessibles au public les dictionnaires des seizième et dix-septième siècles. Après la saisie du Huguet, du Nicot, du Furetière, etc., il sera temps de penser à la saisie du corpus des textes de l'époque. Peu importe ce qui a été fait, ce qui est important est ce qui reste à faire et la façon dont on va s'y prendre. Personnellement, c'est à partir de la concordance qu'il me semble devoir avancer. Au cours de ce colloque nous apprendrons, sans doute, ce que la lemmatisation automatique peut faire, et pourtant, je suis sûr qu'il faudra revoir chaque analyse. L'analyse grammaticale des textes me paraît aussi souhaitable. Ceci peut être fait automatiquement dans une certaine mesure, mais là encore il faudra qu'il y ait une surveillance d'équipe. Il y a aussi le problème de masse. Le véritable corpus des textes de l'époque pourrait présenter des difficultés du point de vue du maniement des données. Ce que je propose, et je m'excuse si cela est déjà mis en route, est que:

Quant au nouveau dictionnaire lui-même, il faudrait qu'il soit possible de rechercher En ce qui concerne le contexte, nous avons un modèle à suivre. Celui de la concordance de la Bible. Ici encore le projet ARTFL peut nous renseigner. Je trouve sa concordance de la version latine de la Bible de St Jérôme excellente. Si on demande un terme, par exemple verbum dans Genèse, on peut l'avoir soit dans son texte complet, soit tout seul. Mais la concordance mise au point par la Bible Browser, me semble encore supérieure. Là, non seulement peut-on trouver le terme dans son contexte immédiat ou entouré de plusieurs versets mais il y a aussi la possibilité de comparer plusieurs versions de la Bible concurremment. Je trouve que le nouveau dictionnaire du seizième siècle bénéficierait considérablement s'il était possible d'afficher une comparaison relative à l'emploi du même terme par plusieurs auteurs.

Pour moi, le dictionnaire, tel que je le conçois, devrait être préparé en hypertexte. (On pourrait aussi mentionner un programme qui a été fait en Suède et que je n'ai pas vu.[6] Les auteurs ont eu l'heureuse idée d'avoir deux versions du texte d'une pièce d'Ibsen qui était à l'origine de leurs recherches, l'une en texte normal et l'autre avec reproduction de l'analyse grammaticale. De cette façon on peut vérifier la syntaxe à n'importe quel moment et faire des analyses grammaticales. Le programme comprend des fenêtres qui permettent à l'utilisateur de demander les renseignements supplémentaires voulus.) Je pense que notre but est de produire un dictionnaire qui pourra fournir les renseignements essentiels avec un minimum d'exemples, permettant les analyses grammaticales, les recherches chronologiques, les concordances d'emploi et ce qui n'est pas négligeable, auquel il sera possible de faire des ajouts, des modifications et, bien sûr, des corrections, à tout moment.

[Retour à la Table des communications]


Notes

6. Hofland et al. 1993.