NEF (Net des études françaises) - Dossiers du NEF

Des "passerelles" linguistiques sur le web (projet de recherche)

par Marie Lebert, mai 2006

Si la fin des années 1990 est marquée par la volonté de développer le multilinguisme sur le web, la priorité aujourd'hui semble être la création de passerelles entre les communautés linguistiques pour favoriser la circulation des écrits dans d’autres langues, par le biais d'outils numériques adaptés. Je suis à la recherche d'un "sponsor" (organisme public ou privé) pour développer ce projet de recherche sur plusieurs années.

Réseau de recherche
Travaux passés et présents
Présentation du projet envisagé


Réseau de recherche

Le Net des études françaises (NEF) est le réseau de recherche auquel j'appartiens. Fondé en mai 2000 par Russon Wooldridge et basé à l'Université de Toronto (Canada), le NEF est un vaste réseau francophone composé de chercheurs, de professeurs et de bibliothécaires. Le NEF s'intéresse notamment au web (textes électroniques, bases de données textuelles, analyse critique du médium) tout en promouvant la diffusion libre du savoir.


Travaux passés et présents

1993-2003
Le Livre 010101 est la recherche que j'ai menée pendant dix ans, entre 1993 et 2003. J'ai étudié comment les technologies numériques ont profondément modifié les habitudes des professionnels du livre (une expression à prendre au sens large) au fil des ans. J'ai accordé une importance particulière à l'édition en ligne, commerciale et non commerciale, et aux langues. Ce travail est basé sur une centaine d'entretiens conduits dans divers pays, entre 1998 et 2003. L'ouvrage de synthèse, un livre numérique en deux volumes (1993-1998 et 1998-2003), est publié en ligne sur le Net des études françaises (NEF) et distribué au format PDF par la librairie numérique Numilog.

2003-2006 (en cours)
Le Dictionnaire du NEF est un dictionnaire francophone de l'internet et des technologies numériques (texte, image et son) pour les professionnels de l'information. Mis en ligne en mars 2003, il est régulièrement actualisé au fil des mois. Comme indiqué par Russon Wooldridge, fondateur du NEF, "la bibliothèque la plus prestigieuse du monde, la Bibliothèque nationale de France, signale parmi ses signets de ressources en ligne accordés avec parcimonie le Net des études françaises, et en particulier le Dictionnaire du NEF."

2003-2006 (en cours)
Les Dossiers du NEF regroupent des dossiers approfondis sur les sujets mentionnés ci-dessus, par exemple sur le Projet Gutenberg (août 2005), grande bibliothèque mondiale au format texte.


Présentation du projet envisagé

Si la fin des années 1990 est marquée par la volonté de développer le multilinguisme sur le web, la priorité aujourd'hui semble être la création de passerelles entre les communautés linguistiques pour favoriser la circulation des écrits dans d’autres langues, par le biais d'outils numériques adaptés. Une étude pourrait être conduite sur plusieurs années, à partir de l'analyse de nombreux sites dans diverses langues et de séries d'entretiens conduits sur les cinq continents, avec trois grands axes:

Des communautés de langues propres au médium
L'internet comme outil de protection des langues minoritaires
Quelles passerelles entre les communautés linguistiques?

Des communautés de langues propres au médium

Sur le web, des communautés de langues se sont constituées selon une langue maternelle donnée, quel que soit le lieu géographique. Ainsi la communauté de la langue espagnole inclut non seulement les usagers d’Espagne et d’Amérique latine, mais aussi les hispanophones vivant aux Etats-Unis, ou encore ceux qui parlent l'espagnol au Maroc. La même remarque vaut pour la Francophonie, une communauté de langue française présente dans soixante-trois pays sur cinq continents. L’internet contribue-t-il à une plus forte identité de la Francophonie, par les voies officielles (par exemple l'Organisation internationale de la francophonie et ses divers opérateurs) et non officielles, et comment? La même remarque concerne tout autant le créole, parlé non seulement dans les Caraïbes mais aussi à Paris, Montréal ou New York. Le site Windows on Haiti, par exemple, promeut le kreyòl (créole haïtien) en accueillant des débats sur de nombreux sujets, y compris les normes d’écriture du kreyòl.

Il existe aussi des communautés qui pratiquent le bilinguisme au quotidien, par exemple à Genève (pour le français et l’allemand), Toronto (pour l'anglais et le français) ou San Francisco (pour l’anglais et l’espagnol). Quelles sont les difficultés rencontrées pour gérer un site complètement bilingue, sinon trilingue ou multilingue? Le cas extrême étant le site de la Communautéeuropéenne et ses vingt langues. Est-on obligé de faire des choix?

L'internet comme outil de protection des langues minoritaires

Contrairement aux clichés véhiculés dans les médias, l’internet ne favorise pas l'hégémonie de l'anglais et n'entraîne pas la disparition des langues minoritaires. L'internet peut au contraire contribuer à protéger ces langues, s'il existe une volonté politique et culturelle dans ce sens. On peut citer par exemple la langue gaélique, qui dispose depuis 2001 d'un correcteur d’orthographe en gaélique, d'une base terminologique en ligne en gaélique et d'une radio en gaélique (écossais et irlandais) disponible en continu sur l’internet. Autre exemple: d’après le fondateur de yourDictionary.com, portail de référence sur les langues, des Indiens d’Amérique ont contacté des linguistes via l'internet pour leur demander d’écrire la grammaire de leur langue et de créer des dictionnaires. Le portail, soucieux de promouvoir toutes les langues sans exception, gère une section spécifique consacrée aux langues menacées d'extinction.

Quelles passerelles entre les communautés linguistiques?

Les échanges entre les communautés linguistiques demandent non seulement une volonté politique et culturelle, mais aussi la mise en place de bons outils: systèmes d’encodage, métalangages numériques et logiciels de traduction automatique.

Les systèmes d’encodage
Par exemple l’Unicode qui, en spécifiant un nombre unique pour chaque caractère, peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d’écriture de la planète. Lancé en 1991, l’Unicode est lisible quels que soient la plate-forme, le logiciel et la langue utilisés. A la grande satisfaction des linguistes, l’Unicode remplace progressivement l’ASCII (American Standard Code for Information Interchange), un système de codage qui traite 128 caractères (à savoir l'anglais), avec des variantes qui prennent en compte les lettres avec accents de quelques alphabets européens). L'Unicode est présent dans les versions récentes du système d’exploitation Windows de Microsoft (Windows NT, Windows 2000, Windows XP, etc.), alors que les versions anciennes utilisaient l’ASCII. L’Unicode dispose de plusieurs variantes en fonction des besoins, par exemple UTF-8, UTF-16 et UTF-32 (UTF: Unicode Transformation Format).

Les métalangages numériques
Par exemple l’UNL (Universal Networking Language), un métalangage utilisé pour le codage, le stockage, la recherche et la communication d’informations multilingues indépendamment d’une langue source donnée. Ce métalangage est élaboré par un programme international rassemblant des organismes appartenant à diverses communautés linguistiques. Débuté en janvier 1997 sous l’égide de l’UNU/IAS (United Nations University / Institute of Advanced Studies), le Programme UNL se poursuit sous l’égide de l’UNDL Foundation (UNDL: Universal Networking Digital Language), fondée en janvier 2001.

Les logiciels de traduction automatique
Un logiciel de traduction analyse le texte dans la langue à traduire (langue source) et génère automatiquement le texte dans la langue désirée (langue cible), en utilisant des règles précises pour le transfert de la structure grammaticale. Des outils sont développés entre autres par les sociétés Softissimo et Systran. Softissimo a mis au point la série de logiciels de traduction Reverso, à côté de produits d’écriture multilingue, de dictionnaires électroniques et de méthodes de langues. Systran est l’auteur du premier logiciel de traduction disponible sur le web, à savoir le Babelfish du moteur de recherche AltaVista, lancé en décembre 1997. Les logiciels de traduction n'ont cessé de s'améliorer au fil des ans, sans toutefois avoir la prétention d'égaler le travail du cerveau humain, tout au moins pour la traduction littéraire. Ces logiciels deviennent-ils satisfaisants? Qu’en est-il de leur utilisation à grande échelle, par exemple pour la traduction d'un livre technique dans une autre langue?


Bibliographie et CV

Page d'accueil des Dossiers du NEF

Page d'accueil du NEF


© 2006 Marie Lebert. Tous droits réservés.