NEF (Net des études françaises) - Dossiers du NEF
par Marie Lebert, mai 2006
Si la fin des années 1990 est marquée par la volonté de développer le multilinguisme sur le web, la priorité aujourd'hui semble être la création de passerelles entre les communautés linguistiques pour favoriser la circulation des écrits dans d’autres langues, par le biais d'outils numériques adaptés. Je suis à la recherche d'un "sponsor" (organisme public ou privé) pour développer ce projet de recherche sur plusieurs années.
Réseau de recherche
Travaux passés et présents
Présentation du projet envisagé
Le Net des études françaises (NEF) est le réseau de recherche auquel j'appartiens. Fondé en mai 2000 par Russon Wooldridge et basé à l'Université de Toronto (Canada), le NEF est un vaste réseau francophone composé de chercheurs, de professeurs et de bibliothécaires. Le NEF s'intéresse notamment au web (textes électroniques, bases de données textuelles, analyse critique du médium) tout en promouvant la diffusion libre du savoir.
1993-2003
Le Livre 010101 est la
recherche que j'ai menée pendant dix ans, entre 1993 et 2003. J'ai étudié
comment les technologies numériques ont profondément modifié les habitudes des
professionnels du livre (une expression à prendre au sens large) au fil des
ans. J'ai accordé une importance particulière à l'édition en ligne, commerciale
et non commerciale, et aux langues. Ce travail est basé sur une centaine
d'entretiens conduits dans divers pays,
entre 1998 et 2003. L'ouvrage de synthèse, un livre numérique en deux volumes
(1993-1998 et 1998-2003), est publié en ligne
sur le Net des études françaises (NEF) et distribué au format PDF par la
librairie numérique Numilog.
2003-2006 (en cours)
Le Dictionnaire du NEF
est un dictionnaire francophone de l'internet et des technologies numériques
(texte, image et son) pour les professionnels de l'information. Mis en ligne en
mars 2003, il est régulièrement actualisé au fil des mois. Comme indiqué par
Russon Wooldridge, fondateur du NEF, "la bibliothèque la plus prestigieuse du
monde, la Bibliothèque nationale de France, signale parmi ses
signets
de ressources en ligne accordés avec parcimonie le Net des études françaises,
et en particulier le Dictionnaire du NEF."
2003-2006 (en cours)
Les Dossiers du NEF
regroupent des dossiers approfondis sur les sujets mentionnés ci-dessus, par
exemple sur le Projet Gutenberg (août 2005),
grande bibliothèque mondiale au format texte.
Si la fin des années 1990 est marquée par la volonté de développer le multilinguisme sur le web, la priorité aujourd'hui semble être la création de passerelles entre les communautés linguistiques pour favoriser la circulation des écrits dans d’autres langues, par le biais d'outils numériques adaptés. Une étude pourrait être conduite sur plusieurs années, à partir de l'analyse de nombreux sites dans diverses langues et de séries d'entretiens conduits sur les cinq continents, avec trois grands axes:
Des communautés de langues propres au médium
L'internet comme outil de protection des langues minoritaires
Quelles passerelles entre les communautés linguistiques?
Sur le web, des communautés de langues se sont constituées selon une langue maternelle donnée, quel que soit le lieu géographique. Ainsi la communauté de la langue espagnole inclut non seulement les usagers d’Espagne et d’Amérique latine, mais aussi les hispanophones vivant aux Etats-Unis, ou encore ceux qui parlent l'espagnol au Maroc. La même remarque vaut pour la Francophonie, une communauté de langue française présente dans soixante-trois pays sur cinq continents. L’internet contribue-t-il à une plus forte identité de la Francophonie, par les voies officielles (par exemple l'Organisation internationale de la francophonie et ses divers opérateurs) et non officielles, et comment? La même remarque concerne tout autant le créole, parlé non seulement dans les Caraïbes mais aussi à Paris, Montréal ou New York. Le site Windows on Haiti, par exemple, promeut le kreyòl (créole haïtien) en accueillant des débats sur de nombreux sujets, y compris les normes d’écriture du kreyòl.
Il existe aussi des communautés qui pratiquent le bilinguisme au quotidien, par exemple à Genève (pour le français et l’allemand), Toronto (pour l'anglais et le français) ou San Francisco (pour l’anglais et l’espagnol). Quelles sont les difficultés rencontrées pour gérer un site complètement bilingue, sinon trilingue ou multilingue? Le cas extrême étant le site de la Communautéeuropéenne et ses vingt langues. Est-on obligé de faire des choix?
Contrairement aux clichés véhiculés dans les médias, l’internet ne favorise pas l'hégémonie de l'anglais et n'entraîne pas la disparition des langues minoritaires. L'internet peut au contraire contribuer à protéger ces langues, s'il existe une volonté politique et culturelle dans ce sens. On peut citer par exemple la langue gaélique, qui dispose depuis 2001 d'un correcteur d’orthographe en gaélique, d'une base terminologique en ligne en gaélique et d'une radio en gaélique (écossais et irlandais) disponible en continu sur l’internet. Autre exemple: d’après le fondateur de yourDictionary.com, portail de référence sur les langues, des Indiens d’Amérique ont contacté des linguistes via l'internet pour leur demander d’écrire la grammaire de leur langue et de créer des dictionnaires. Le portail, soucieux de promouvoir toutes les langues sans exception, gère une section spécifique consacrée aux langues menacées d'extinction.
Les échanges entre les communautés linguistiques demandent non seulement une volonté politique et culturelle, mais aussi la mise en place de bons outils: systèmes d’encodage, métalangages numériques et logiciels de traduction automatique.
Les systèmes d’encodage
Par exemple
l’Unicode qui, en spécifiant un nombre
unique pour chaque caractère, peut traiter 65.000 caractères uniques et prendre
en compte tous les systèmes d’écriture de la planète. Lancé en 1991, l’Unicode
est lisible quels que soient la plate-forme, le logiciel et la langue utilisés.
A la grande satisfaction des linguistes, l’Unicode remplace progressivement
l’ASCII (American Standard Code for Information Interchange), un système de
codage qui traite 128 caractères (à savoir l'anglais), avec des variantes qui
prennent en compte les lettres avec accents de quelques alphabets européens).
L'Unicode est présent dans les versions récentes du système d’exploitation
Windows de Microsoft (Windows NT, Windows 2000, Windows XP, etc.), alors que
les versions anciennes utilisaient l’ASCII. L’Unicode dispose de plusieurs
variantes en fonction des besoins, par exemple UTF-8, UTF-16 et UTF-32
(UTF: Unicode Transformation Format).
Les métalangages numériques
Par exemple
l’UNL (Universal
Networking Language), un métalangage utilisé pour le codage, le stockage, la
recherche et la communication d’informations multilingues indépendamment d’une
langue source donnée. Ce métalangage est élaboré par un programme international
rassemblant des organismes appartenant à diverses communautés linguistiques.
Débuté en janvier 1997 sous l’égide de l’UNU/IAS (United Nations University /
Institute of Advanced Studies), le Programme UNL se poursuit sous l’égide de
l’UNDL Foundation (UNDL: Universal Networking
Digital Language), fondée en janvier 2001.
Les logiciels de traduction automatique
Un logiciel de traduction
analyse le texte dans la langue à traduire (langue source) et génère
automatiquement le texte dans la langue désirée (langue cible), en utilisant
des règles précises pour le transfert de la structure grammaticale. Des
outils sont développés entre autres par les sociétés Softissimo et Systran.
Softissimo a mis au point la série de
logiciels de traduction Reverso, à côté de produits d’écriture multilingue, de
dictionnaires électroniques et de méthodes de langues.
Systran est l’auteur du premier
logiciel de traduction disponible sur le web, à savoir le
Babelfish du moteur de recherche
AltaVista, lancé en décembre 1997. Les logiciels de traduction n'ont cessé de
s'améliorer au fil des ans, sans toutefois avoir la prétention d'égaler le
travail du cerveau humain, tout au moins pour la traduction littéraire. Ces
logiciels deviennent-ils satisfaisants? Qu’en est-il de leur utilisation à
grande échelle, par exemple pour la traduction d'un livre technique dans une
autre langue?
Bibliographie et CV
Page d'accueil des Dossiers du NEF
© 2006 Marie Lebert. Tous droits réservés.