Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.", Clermont-Ferrand, 14-15 juin 1996 | K. Cameron, "De la concordance au dictionnaire" |
Pour clore ce tour d'horizon, j'aimerais citer les exemples du programme de morphologie. On peut entrer n'importe quelle phrase qui sera analysée automatiquement. Cette analyse est pourtant purement mécanique et ne montre aucun signe d'intelligence. Si on entre 'tu l'as vue', on reçoit l'analyse suivante:
ARTFL Project: Morphology Results
Input Term(s): tu l'as vue
tu 3 taire+PaPrt+Masc+SG+Verb taire+PaPrt+Verb tu+Nom+InvGen+SG+P2+PC l'as 2 l'+Acc+InvGen+SG+P3+PC|avoir+IndP+SG+P2+Verb l'+SG+Art|as+Masc+InvPL+Noun vue 3 voir+PaPrt+Fem+SG+Verb vue+Fem+SG+Noun vu+Fem+SG+Adjchaque terme peut avoir au moins deux analyses grammaticales -- il en est ainsi pour il me la porte, où la peut être un pronom ou un article et porte peut être inclus dans six catégories.
ARTFL Project: Morphology Results
Input Term(s): il me la porte
il 1 il+Nom+Masc+SG+P3+PC me 1 me+NNom+InvGen+SG+P1+PC la 2 le+Acc+Fem+SG+P3+PC le+Fem+SG+Def+Art porte 6 porter+SubjP+SG+P1+Verb porter+SubjP+SG+P3+Verb porter+Imp+SG+P2+Verb porter+IndP+SG+P1+Verb porter+IndP+SG+P3+Verb porte+Fem+SG+NounJe ne voudrais pas donner l'impression de dédaigner les efforts de ceux qui ont mis au point les programmes que j'ai cités, car, bien au contraire, je les admire. Ils ont su faire face à beaucoup d'obstacles et ont réussi à mettre au point des dictionnaires qui fournissent une aide précieuse. Il me semble pourtant que si les Journées 'Dictionnaires électroniques' ont eu lieu c'est parce que nous croyons pouvoir, et devoir, toujours chercher des moyens d'améliorer et de perfectionner ces outils de travail. Je pourrais tout aussi bien indiquer des erreurs et des faiblesses dans les concordances que j'ai préparées moi-même.
Ne tournons pas plus longtemps autour du pot. Il est évident que l'équipe de Clermont-Ferrand travaille depuis au moins deux ans sur une affaire intéressante. Elle est en train de rendre accessibles au public les dictionnaires des seizième et dix-septième siècles. Après la saisie du Huguet, du Nicot, du Furetière, etc., il sera temps de penser à la saisie du corpus des textes de l'époque. Peu importe ce qui a été fait, ce qui est important est ce qui reste à faire et la façon dont on va s'y prendre. Personnellement, c'est à partir de la concordance qu'il me semble devoir avancer. Au cours de ce colloque nous apprendrons, sans doute, ce que la lemmatisation automatique peut faire, et pourtant, je suis sûr qu'il faudra revoir chaque analyse. L'analyse grammaticale des textes me paraît aussi souhaitable. Ceci peut être fait automatiquement dans une certaine mesure, mais là encore il faudra qu'il y ait une surveillance d'équipe. Il y a aussi le problème de masse. Le véritable corpus des textes de l'époque pourrait présenter des difficultés du point de vue du maniement des données. Ce que je propose, et je m'excuse si cela est déjà mis en route, est que:
ARTFL Project: Bible Concordance
Go to Bibliography
Searching 1 documents for verbum. Total Occurences = 1
Report
Genesis, C 44:ine mi loquatur servus tuus verbum in auribus tuis et ne irascaris fa
Bibliography
Latin Vulgate Genesis 405 (Network Version, 1994)
ARTFL Project: Bible Concordance
Go to Bibliography
Searching 1 documents for verbum. Total Occurences = 1
Genesis, Chapter 44
vel quid loquemur aut iusti poterimus obtendere Deus invenit iniquitatem
servorum tuorum en omnes servi sumus domini mei et nos et apud quem inventus
est scyphus
17 respondit Ioseph absit a me ut sic agam qui furatus est scyphum ipse sit
servus meus vos autem abite liberi ad patrem vestrum
18 accedens propius Iudas confidenter ait oro domine mi loquatur servus tuus
verbum in auribus tuis et ne irascaris famulo tuo tu es enim post Pharaonem
19 dominus meus interrogasti prius servos tuos habetis patrem aut fratrem
20 et nos respondimus tibi domino meo est nobis pater senex et puer parvulus
qui in senecta illius natus est cuius uterinus frater est mortuus et ipsum
solum habet mater sua pater vero tenere diligit eum
21 dixistique
Report
Pour moi, le dictionnaire, tel que je le conçois, devrait être préparé en hypertexte. (On pourrait aussi mentionner un programme qui a été fait en Suède et que je n'ai pas vu.[6] Les auteurs ont eu l'heureuse idée d'avoir deux versions du texte d'une pièce d'Ibsen qui était à l'origine de leurs recherches, l'une en texte normal et l'autre avec reproduction de l'analyse grammaticale. De cette façon on peut vérifier la syntaxe à n'importe quel moment et faire des analyses grammaticales. Le programme comprend des fenêtres qui permettent à l'utilisateur de demander les renseignements supplémentaires voulus.) Je pense que notre but est de produire un dictionnaire qui pourra fournir les renseignements essentiels avec un minimum d'exemples, permettant les analyses grammaticales, les recherches chronologiques, les concordances d'emploi et ce qui n'est pas négligeable, auquel il sera possible de faire des ajouts, des modifications et, bien sûr, des corrections, à tout moment.
[Retour à la Table des communications]
Notes