Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
P. Caron & B.-R. Hwang, "L'informatisation du Dictionaire Critique de la Langue Française (1787)"

Cette communication se situe dans le fil du colloque de Nancy [1], au cours duquel nous avions mis en démonstration libre la lettre A du Féraud informatisé, soit 10% du total des pages environ.

Pour mémoire, je rappelle qu'institutionnellement parlant ce programme est coordonné par le G.D.R. 841 du C.N.R.S., le G.E.H.L.F. qui est rattaché à l'INaLF depuis 1992.

Il fédère pour l'occasion trois laboratoires qui, à des titres divers, participent au projet: deux laboratoires de Limoges, le TELMOO [2] et le RESSAC [3], ainsi que l'équipe de recherche Morin-Dagenais de l'Université de Montréal [4]. C'est notre laboratoire, le RESSAC qui a porté le poids de cette communication, d'où son affichage en tête du présent texte.

1. État du projet

Nous avons le plaisir d'annoncer aujourd'hui que ce projet est en très bonne voie: nous venons de finir la saisie du deuxième volume qui va des lettres E à N. Les routines de révision (codes et caractères) vont s'échelonner jusqu'en septembre parallèlement à la saisie du troisième et dernier volume. Au total ce sont 2600 pages environ qui auront été enregistrées à partir du cahier de saisie parachevé par Louise Dagenais en mai 1995.

Nous pratiquons sur la saisie brute trois niveaux de relecture:

La base est donc propre. Une seule asymétrie demeure entre le premier tome et les deux autres: nous avons décidé de saisir différemment les points de ponctuation et les points d'abréviation à partir du deuxième volume. Il restera donc à pratiquer de lourdes macro-commandes de recherche remplacement sur les formes univoques du premier volume et à corriger ce qui restera inévitablement lors de l'ultime relecture qui prendra place dans le courant de 1997-1998. Pour le présent colloque, nous avons décidé de vous présenter un aperçu de la base sous TACT [5]. L'an dernier, à Nancy, nous avions préparé la lettre A sous Wordcruncher. Cette année encore, la restitution de la typographie à l'écran n'est pas encore d'actualité mais nous travaillons évidemment avec l'idée de trouver une interface-utilisateur capable de la traiter.

Ce que nous allons interroger devant vous, c'est le premier volume qui contient, paratextes tels que préface, dédicace et liste d'auteurs non compris, exactement 840 pages de texte lexicographique.

[Suite] -- [Retour à la Table des matières]


Notes

1. Colloque international autour de l'informatisation du Trésor de la langue française, les 29, 30 et 31 mai 1995. Actes à paraître.

2. Le TELMOO est un laboratoire de l'Université de Limoges qui s'intéresse particulièrement à l'informatisation de textes médiévaux. Il a déjà édité les concordances de nombreuses oeuvres médiévales mais son projet principal est l'édition électronique synoptique des textes lyriques d'oc. Il est dirigé par Gérard GONFROY.

3. Recherches syntaxiques et sémantiques sur l'Age Classique. Adresse: IUFM du Limousin, 209 Bd de Vanteaux, 87036 LIMOGES CEDEX.

4. Cette équipe de recherche dirigée par Yves-Charles Morin et Louise Dagenais s'est spécialisée dans l'histoire de la quantité vocalique en français. Récemment elle a ajouté un volet métalexicographique à son programme, étudiant la genèse de l'appareil de marques d'usage dans la tradition métalexicographique française.

5. TACT est un logiciel de recherche de données textuelles développé à l'Université de Toronto. [NDLR. La version 2.1 de TACT peut être téléchargée gratuitement depuis http://www.chass.utoronto.ca:8080/cch/tact.html; un livre-manuel, Using TACT with Electronic Texts, accompagné d'un CD-ROM contenant le programme lui-même et un choix de textes littéraires en plusieurs langues interrogeables sous TACT, est distribué par la Modern Language Association au prix de $50 US. Pour de plus amples renseignements (en anglais), voir la notice Distribution de TACT.]