Une bonne version électronique de dictionnaires anciens ?
Définitions, objectifs et risques :
manifeste pour le respect des consultants
Préalables
Du XVe siècle à nos jours, la variété et la richesse des productions lexicographiques, Thresors, Lexiques, Glossaires, Vocabulaires et Dictionnaires qui ont évolué dans leurs objectifs, leurs formes et leurs contenus impliquent de bien comprendre en tous ses aspects les modalités de fonctionnement du texte que l’on souhaite informatiser et, en conséquence, d’élaborer pour chaque objet une méthodologie spécifique adaptée aux caractéristiques intrinsèques des ouvrages, bibliologiques, historiques, linguistiques, épistémologiques, etc.
1° Qu’attendre de l’informatisation de dictionnaires anciens, en accès libre sur internet ou sur cédérom
disposer de références bibliographiques précises sur les ouvrages informatisés et connaître les critères qui ont présidé à leur choix par des spécialistes reconnus pour leurs compétences.
bénéficier d’une contextualisation historique et scientifique minimale, non minimaliste, des dictionnaires constitués en bases de données dont les choix d’édition, aux deux sens du terme, soient garantis à l’utilisateur par des travaux faisant autorité, reconnus à l’échelle internationale par des spécialistes ayant eux-mêmes donné des preuves de sérieux dans leurs publications.
pouvoir interroger ad libitum les bases de données, sans restriction arbitraire qui limite à un nombre donné l’exploitation des résultats de l’interrogation par sessions de travail, quel que soit le support considéré.
être en mesure de consulter simultanément sur un même écran les textes de différents ouvrages que l’on souhaite comparer, en transférer les données sur traitement de texte sans perte des caractéristiques typographiques et imprimer, entre autres, des listes de nomenclatures choisies.
avoir la possibilité de mener conjointement plusieurs sortes d’interrogations, formelles (typographiques, topologiques, etc…) ou fonctionnelles (via les outils associés), sans limitation de nombre de caractères (interrogations sur la ponctuation, les morphèmes de haute fréquence inférieurs à trois caractères, etc.).
permettre au consultant non averti de disposer du minimum d’informations critiques l’aidant à distinguer la valeur des résultats d’une exploitation informatique et celle d’une consultation maîtrisée par sa lecture, sa connaissance des textes et de leurs contextes, dans leur double dimension historique et fonctionnelle, pour garantir l’exactitude d’interprétation des résultats issus de requêtes spécifiques : ainsi, la recherche des sources directes ou indirectes, de Nicot, Richelet, Littré ou Larousse, telles qu’elles apparaissent dans leurs ouvrages, ou une extraction de lexique thématique dans des dictionnaires n’utilisant pas systématiquement un marquage des domaines.
2° Définitions et exigences minimales
L’édition électronique de dictionnaires anciens destinée à un large public rend nécessaire l’exigence déontologique de transparence des sources, des principes éditoriaux et des critères ayant présidé au choix d’une méthodologie adaptée aux spécificités de chaque texte :
Tout consultant d’un texte informatisé doit connaître la référence bibliographique précise et exacte de l’exemplaire original utilisé pour la saisie ; il doit être également assuré que le seul et même exemplaire a été utilisé pour les corrections : pourquoi aller chercher au fin fonds de l’étranger l’exemplaire de dictionnaires français dont des originaux sont conservés dans les grandes bibliothèques de France, en premier lieu celle de l’Institut de France pour les différentes éditions du Dictionnaire de l’Académie Française ? L’intérêt de la production d’un fac simile, en admettant que celui-ci soit consultable sur un même écran à côté du texte saisi, est neutralisé sans la mention précise de l’original utilisé, si précieux soit-il, surtout s’il n’est pas accessible aisément au public souhaitant avoir recours au livre imprimé.
Toutes les références bibliographiques doivent être fiables : erreurs et omissions discréditent les éditeurs. Une vulgarisation sérieuse donne, entre autres, des bibliographies signalant les travaux pionniers et permettant d’accéder de manière rigoureuse et ouverte à des sources plus circonstanciées et conformes à l’esprit de la recherche.
L’association sur un même support d’objets hétérogènes, souvent envisagés à la légère, avec modification des intitulés des textes choisis, erreurs de datations, transformation des textes (translation-traduction), et sans justification claire de la démarche adoptée, risque d’induire en erreur un public non averti et trahit dommageablement l’esprit des ouvrages traités. Comment garantir dans ces conditions une politique éditoriale respectable fondée sur des critères méthodologiques sérieux, et en premier une absolue fidélité aux documents de référence ?
« Baliser un texte, c'est le penser » (R. Wooldridge, Paris, 1997) : on ne travaillera absolument pas de façon identique sur les dictionnaires de Nicot, Richelet, Furetière, Ménage, Corneille, sur celui de l’Académie française, sur l’Encyclopédie, le Littré ou le Grand Dictionnaire Universel du XIXe siècle de P. Larousse du seul fait des importantes différences formelles, fonctionnelles et sémiotiques de chacun de ces ouvrages qui conditionnent des méthodes spécifiques d’accès à l’ensemble des informations contenues, notamment par la constitution d’outils efficaces et fiables associés aux bases de données. Le balisage minimal formel n’a de pertinence qu’à proportion de la fidélité matérielle de la saisie, assortie d’une fidélité philologique : effectué sans discernement, il ne donne qu’un accès automatique aux mots, sans regroupement ni autre systématisation que formelle. Il doit donc être enrichi par des outils complémentaires : ainsi des listes de mots-clés métalinguistiques constituées, non pas arbitrairement selon des critères indifférents aux contextes de parution des ouvrages considérés, mais bien à partir de la mise en place d’un balisage intermédiaire rigoureux des différentes marques (usage, domaines, etc…) présentes dans les textes de base, et intégrant leur historicité propre.
Pour l’avenir
Dès lors s’impose une conclusion : la confiance du lectorat ne peut qu’être fonction du degré de la fidélité aux textes que manifestent les éditeurs. Si, conformément à l’étymologie, l’on croit que l’informatique offre un accès automatique à l’information, on conviendra donc que pour être nette et ne pas produire un fallacieux savoir et une connaissance des documents étique, l’électronisation des documents anciens repose nécessairement sur une éthique sincère de respect de leurs auteurs, des textes et de leurs lecteurs.
Isabelle TURCAN
Université Jean Moulin Lyon III
Institut universitaire de France
Jacques-Philippe SAINT-GÉRAND
Université Blaise Pascal Clermont-Ferrand II
|