NEF - Le Livre 010101 de Marie Lebert - Entretiens 1998-2001 - Zina Tucsnak

Zina Tucsnak (Nancy)
Ingénieur d'études en informatique à l'ATILF (Analyses et traitements informatiques du lexique français)

L'ATILF a développé des programmes de recherche sur la langue française, principalement son vocabulaire. Traitées par des systèmes informatiques spécifiques, les données (lexicales et textuelles) portent sur divers registres du français : langue littéraire (du 14e au 20e siècle), langue courante (écrite et parlée), langue scientifique et technique (terminologies), et régionalismes.

Les bases de données de l'ATILF comprennent notamment: (1) Frantext, un corpus à dominante littéraire constitué de textes français qui s'échelonnent du 16e au 20e siècle. Sur l'intégralité du corpus, il est possible d'effectuer des recherches simples ou complexes (base non catégorisée). Sur un sous-ensemble comportant des oeuvres en prose des 19e et 20e siècles, les recherches peuvent également être effectuées selon des critères syntaxiques (base catégorisée); (2) l'Encylopédie de Diderot et d'Alembert, en collaboration avec l'ARTFL (American and French Research on the Treasury of the French Language) de l'Université de Chicago. Il s'agit de la version internet de la première édition, à savoir 17 volumes de texte et 11 volumes de planches; (3) Dictionnaires d'autrefois (16e-19e siècles): Dictionnaires de l'Académie française, 1re (1694), 5e (1798), et 6e (1835) éditions, Dictionarium latinogallicum de Robert Estienne, Thresor de la langue françoyse (versions ancienne et moderne) de Jean Nicot, Dictionnaire historique et critique de Pierre Bayle; (4) le Catalogue critique des ressources textuelles sur internet (CCRTI), un ensemble de sites qui diffusent des ressources textuelles en ligne sur le web, sélectionnés en fonction de leur sérieux sur le plan du traitement éditorial et du traitement numérique des textes; (5) le Dictionnaire de l'Académie française, 8e édition (1932).


Entretien du 23 octobre 2000

Pouvez-vous présenter votre organisme?

Je fais partie du CNRS (Centre national de la recherche scientifique), plus précisément du département des Sciences de l'homme et de la société (SHS). L'ATILF (Analyses et traitements informatiques du lexique français) participe activement à la valorisation des innovations scientifiques et techniques et au rayonnement de la culture française à l'étranger.

En quoi consiste exactement votre activité professionnelle?

Je suis ingénieure informaticienne. Mon travail s'articule autour de deux axes principaux: gérer des bases textuelles informatisées (Encyclopédie Diderot, Dictionnaires d'autrefois) et assurer l'administration des serveurs de notre laboratoire. Je gère plusieurs sites internet: Encyclopédie Diderot, Dictionnaires d'autrefois, Webcourrier et Ressources informatiques à l'INaLF.

Comment voyez-vous l'avenir?

Je ne conçois pas l'avenir sans internet. C'est une évolution constante.

Utilisez-vous encore des documents papier?

Non, pas personnellement. Les dictionnaires électroniques et autres e-books révolutionnent l'accès à la culture. En quelques clics, l'utilisateur peut trouver l'information recherchée.

Quelle est votre opinion sur le livre électronique?

L'e-book offre une combinaison d'opportunités: la digitalisation et l'internet. Les éditeurs apportent leur titres à tous les lecteurs du monde. C'est une nouvelle ère de la publication.

Quelles sont vos suggestions pour un meilleur respect du droit d'auteur sur le web?

Le droit en informatique et en particulier le droit d'auteur sur la toile est une discipline de plus en plus développée et recherchée. Malgré quelques cas qui ont fait jurisprudence, le législateur n'est pas en mesure de solutionner toute la problématique actuelle. L'absence des frontières est un gros handicap.

Quelles sont vos suggestions pour une meilleure répartition des langues sur le web?

C'est un vaste problème. Le meilleur moyen sera l'application d'une loi par laquelle on va attribuer un "quota" à chaque langue. Mais est-ce que ce n'est pas une utopie de demander l'application d'une telle loi dans une société de consommation comme la nôtre?

Quelles sont vos suggestions pour une meilleure accessibilité du web aux aveugles et malvoyants?

Il faudrait fournir des alternatives équivalentes au contenu visuel et auditif: le texte peut être expédié directement à des synthétiseurs vocaux et à des générateurs de braille et peut être représenté sur du papier.La voix synthétique et le braille sont indispensables aux individus non voyants et mal entendants.

Comment définissez-vous le cyberespace?

Je crois que, dans le cyberespace, l'information et la quantité de l'information sont gouvernées par des lois mathématiques. Mais les modèles mathématiques n'ont pas trouvé encore leur solution, un peu comme le mouvement perpétuel ou la quadrature du cercle.

Et la société de l'information?

La société de l'information peut être définie comme un milieu dans lequel se développent la culture et la civilisation par l'intermédiaire de l'informatique, qui restera la base et la théorie de cette société.

Quel est votre meilleur souvenir lié à l'internet?

Mon meilleur souvenir est lié à la mise en oeuvre d'un serveur qui permet la lecture de son courrier depuis n'importe quel ordinateur muni d'une connexion internet. Le principe d'un tel serveur existait déjà, surtout sur des grandes sites américains. Mais rien ne remplace la sensation du devoir accompli.

Et votre pire souvenir?

Ce sont les CV bidons, publiés sur des pages personnelles. Surtout quand les auteurs s'appropient des réalisations ou des activités qu'ils n'effectuent pas. Mais cela ouvre un débat plus large sur la répression des fraudes sur internet.


Liste des Entretiens
Page d'accueil du Livre 010101
Page d'accueil du NEF


© 2000 Zina Tucsnak & Marie Lebert