NEF - Le Livre 010101 de Marie Lebert - Le multilinguisme sur le Web

Le multilinguisme sur le Web (1999)
3. Ressources linguistiques

3.1. Sites indexant des ressources linguistiques
3.2. Répertoires linguistiques
3.3. Dictionnaires et glossaires
3.4. Bases de données textuelles
3.5. Bases de données terminologiques


3.1. Sites indexant des ressources linguistiques

Préparé par le programme Télématique pour les bibliothèques de la Commission européenne, Multilingual Tools and Services (Outils et services multilingues) propose une série de dictionnaires, instruments d'aide multilingues, projets, moteurs de recherche par langue, banques de données terminologiques, thésaurus et systèmes de traduction.

Créée par Tyler Chambers en mai 1994, The Human-Languages Page (La page des langues humaines) est un catalogue détaillé de 1.800 ressources linguistiques dans plus de 100 langues différentes. Les différentes sections sont: langues et littérature, écoles et institutions, ressources linguistiques, produits et services, organismes, emplois et stages, dictionnaires et cours de langues.

Tyler Chambers mène aussi un autre projet relatif aux langues, l'Internet Dictionary Project (Projet de dictionnaire Internet). Sur le site web, il explique:

"Le but de l'Internet Dictionary Project est de créer des dictionnaires de traduction grâce à l'aide des internautes. Ce site permet aux individus du monde entier de consulter et de participer à la traduction de termes anglais dans d'autres langues. Les listes de termes anglais et leurs correspondants dans d'autres langues sont ensuite mis à la disposition de tous sur ce site, sans restriction d'aucune sorte. [...]

The Internet Dictionary Project a débuté en 1995 pour combler une lacuune et procurer à la communauté d'Internet et à tous ceux qui s'intéressent à l'informatique des dictionnaires de traduction gratuits. Non seulement il est très utile d'avoir immédiatement accès à des dictionnaires via le World Wide Web, mais ceci permet aussi le développement de logiciels pouvant tirer parti de tels dictionnaires, que ce soit des programmes de traduction ou des vérificateurs d'orthographe ou encore des guides d'apprentissage des langues. En facilitant la création de ces dictionnaires en ligne par des milliers de volontaires, et en les mettant gratuitement à la disposition de tous, l'Internet Dictionary Project espère imprimer sa marque sur Internet et susciter d'autres projets qui seront plus bénéfiques que des revenus purement financiers."

Tyler Chambers a répondu à mes questions dans son courrier électronique du 14 septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

TC: "Le multilinguisme sur le Web était inévitable bien avant que ce médium ne se développe vraiment. Mon premier vrai contact avec Internet date de 1994, un peu après ses débuts mais bien avant son expansion. 1994 a été aussi l'année où j'ai débuté mon premier projet web multilingue, et il existait déjà un nombre significatif de ressources linguistiques en ligne. Ceci était antérieur à la création de Netscape. Mosaic était le seul navigateur sur le Web, et les pages web étaient essentiellement des documents textuels reliés par des hyperliens. Suite à l'expérience acquise maintenant par les navigateurs et les cybernautes, je ne pense pas qu'il existe une langue vivante qui ne soit pas représentée sur le Web, que ce soit la langue des Indiens d'Amérique ou les dialectes moyen-orientaux. De même une pléthore de langues mortes peut maintenant trouver une audience nouvelle avec des érudits et autres spécialistes en ligne. A ma connaissance, très peu de jeux de caractères ne sont pas disponibles en ligne: les navigateurs ont maintenant la possibilité de visualiser les caractères romains, asiatiques, cyrilliques, grecs, turcs, etc. Accent Software a un produit appelé "Internet avec accents" qui prétend être capable de visualiser plus de 30 codages différents. S'il existe encore des obstacles à la diffusion d'une langue spécifique sur le Web, ceci ne devrait pas durer."

ML: "Quel a été le bénéfice de l'utilisation d'Internet dans votre vie professionnelle?"

TC: "Ma vie professionnelle est en ce moment complètement distincte de mon activité sur Internet. Je suis un programmeur/technicien informatique, je trouve cela stimulant et cela me permet de payer les factures. Mon activité en ligne a été de rendre l'information linguistique accessible à davantage de gens par le biais de deux de mes projets sur le Web. Bien que je ne sois pas multilingue, ni même bilingue moi-même, je suis conscient du fait que très peu de domaines ont une importance comparable à celle des langues et du multilinguisme. Internet m'a permis de toucher des millions de personnes et de les aider à trouver ce qu'elles cherchaient, chose que je suis heureux de faire. Je suis devenu aussi une sorte de célébrité, ou au moins quelqu'un de familier dans certains cercles. Je viens de découvrir qu'un de mes projets est brièvement mentionné dans les éditions asiatique et internationale de Time Magazine. Dans l'ensemble, je pense que le Web a été important pour la sensibilisation aux langues et pour les questions culturelles. Dans quel autre endroit peut-on chercher au hasard pendant vingt minutes et trouver des informations susceptibles de vous intéresser dans trois langues différentes sinon plus? Les médias de communication rendent le monde plus petit en rapprochant les gens; je pense que le Web est le premier médium - bien plus que le courrier, le télégraphe, le téléphone, la radio ou la télévision - à réellement permettre à l'usager moyen de franchir les frontières nationales et culturelles. Israël n'est plus à des milliers de kilomètres, mais seulement à quelques clics de souris. Notre monde est maintenant suffisamment petit pour tenir sur un écran d'ordinateur."

ML: "Comment voyez-vous l'évolution vers un Internet multilingue?"

TC: "Comme je l'ai dit plus haut, je pense que l'avenir d'Internet réside dans davantage de multilinguisme et d'exploration et de compréhension multiculturelles que nous n'en avons jamais vu. Cependant Internet sera seulement le médium au travers duquel l'information circule. Comme le papier qui sert de support au livre, Internet lui-même augmente très peu le contenu de l'information. Par contre il augmente énormément la valeur de celle-ci dans la capacité qu'il a à communiquer cette information. Dire qu'Internet aiguillonne le multilinguisme est à mon sens une opinion fausse. C'est la communication qui aiguillonne le multilinguisme et l'échange multiculturel, Internet est seulement le mode de communication le plus récent rendu accessible aux gens plus ou moins ordinaires. Internet a un long chemin à parcourir avant d'être omniprésent dans le monde entier, mais il est vraissemblable que lui-même ou un médium de la même lignée y arrive. Les langues deviendront encore plus importantes qu'elles ne le sont quand tout le monde pourra communiquer à l'échelle de la planète (à travers le Web, les discussions, les jeux, le courrier électronique, ou toute application appartenant encore au domaine de l'avenir), mais je ne sais pas si ceci mènera à un renforcement des attaches linguistiques ou à une fusion des langues jusqu'à ce qu'il n'en subsite plus que quelques-unes ou même une seule. Une chose qui m'apparaît certaine est qu'Internet sera toujours la marque de notre diversité, y compris la diversité des langues, même si cette diversité diminue. Et c'est une des choses que j'aime au sujet d'Internet, c'est un exemple à l'échelle mondiale du dicton: 'Cela n'a pas vraiment disparu tant que quelqu'un s'en souvient.' Et les gens se souviennent."

Depuis ses débuts en 1989, le CTI (Computer in Teaching Initiative) Centre for Modern Languages (Centre pour l'utilisation des ordinateurs dans l'enseignement des langues modernes) est inclus dans l'Institut des langues de l'Université d'Hull (Royaume-Uni) et vise à promouvoir l'utilisation des ordinateurs dans l'apprentissage et l'enseignement des langues. Le Centre procure des informations sur la manière dont l'apprentissage des langues assisté par ordinateur peut être effectivement intégré à des cours existants en offrant un soutien aux professeurs qui utilisent, ou souhaitent utiliser, l'informatique dans l'enseignement qu'ils dispensent.

June Thompson, responsable du Centre, a répondu à mes questions dans son courrier électronique du 14 décembre 1998.

ML: "Comment voyez-vous le multilinguisme sur Internet?"

JT: "Avec Internet, on a la possibilité d'accroître l'utilisation des langues étrangères, et notre organisation ne soutient absolument pas la suprématie de l'anglais en tant que langue d'Internet. Une intéressante conférence sur ce sujet a été donnée par Madanmohan Rao à la Conférence WorldCALL de Melbourne en juillet 1998. [Voir la présention de l'ouvrage à paraître suite à la conférence.]

ML: "Quel a été le bénéfice de l'utilisation d'Internet dans votre activité?"

JT: "L'utilisation d'Internet a apporté une nouvelle dimension à notre tâche qui consiste à soutenir les professeurs de langue dans l'utilisation de la technologie correspondante."

ML: "Comment voyez-vous l'évolution vers un Internet multilingue?"

JT: "Je pense que dans un avenir proche l'utilisation de supports linguistiques sur Internet va continuer à se développer en même temps que d'autres activités liées à la technologie (par exemple l'utilisation de CD-ROM - certains établissements n'ont pas suffisamment de matériel informatique en réseau). A l'avenir il me semble que l'utilisation d'Internet jouera un rôle plus grand, mais seulement si ces activités sont à caractère pédagogique. Notre organisme travaille étroitement avec le WELL project [Web Enhanced Language Learning - Apprentissage des langues grâce au Web], qui se consacre à ces problèmes."

Hébergé par le CTI Centre for Modern Languages et l'Université d'Hull (Royaume-Uni), EUROCALL (European Association for Computer Assisted Language Learning) (Association européenne pour l'apprentissage des langues assisté par ordinateur) regroupe des professionnels de l'enseignement des langues exerçant en Europe et dans le monde entier. Ses objectifs sont de favoriser l'utilisation des langues étrangères en Europe, ainsi qu'une vision européenne de l'utilisation de la technologie pour l'apprentissage des langues et l'élaboration et la diffusion d'un matériel de qualité.

EUROCALL soutient aussi deux groupes: CAPITAL (Computer Assisted Pronunciation Investigation Teaching and Learning) (Investigation, enseignement et apprentissage de la prononciation assistés par ordinateur), qui est un groupe de chercheurs et de praticiens souhaitant utiliser l'informatique dans le domaine de la prononciation pris dans le sens le plus large du terme, et WELL (Web Enhanced Language Learning) (Apprentissage des langues grâce au Web), qui procurera l'accès à des ressources web de qualité dans douze langues différentes. Sélectionnées et décrites par des experts, ces ressources seront complétées par des informations et des exemples sur la manière de les utiliser pour l'enseignement et l'apprentissage d'une langue.

Internet Resources for Language Teachers and Learners (Ressources Internet pour l'enseignement et l'apprentissage des langues) propose plusieurs catégories de liens: ressources linguistiques générales (centres et départements, dictionnaires et grammaires, listes de discussion, apprentissage des langues à distance, caractères, compte-rendus, linguistique, listes et index, divers, journaux et périodiques, organismes, ressources, sites linguistiques multilingues, moteurs de recherche et index, sites linguistiques commerciaux (audiovisuels, écoles de langue, ressources et répertoires, logiciels).

Géré par l'Institut des sciences phonétiques d'Amsterdam (Pays-Bas), Speech on the Web (Parole sur le Web) est un répertoire de liens organisés en différentes sections: congrès, réunions et ateliers, liens et listes, phonétique et parole, traitement de la langue naturelle, sciences cognitives et intelligence artificielle, linguistique computationnelle, dictionnaires, lettres d'information électroniques, revues et publications.

Travlang est un site dédié à la fois aux voyages et aux langues. Créé par Michael C. Martin en 1994 sur le site de son université alors qu'il était étudiant en physique (il est maintenant chercheur au Lawrence Berkeley National Laboratory, en Californie), Foreign Languages for Travelers (Langues étrangères pour les voyageurs), inclus dans Travlang en 1995, donne la possibilité d'apprendre 60 langues différentes sur le Web. Translating Dictionaries (Dictionnaires de traduction) donne accès à des dictionnaires gratuits dans diverses langues (afrikaans, allemand, danois, espagnol, espéranto, finnois, français, frison, hollandais, hongrois, italien, latin, norvégien, portugais et tchèque). Le site offre aussi de nombreux liens vers des dictionnaires de langue, services de traduction, écoles de langue, librairies multilingues, etc.

Michael C. Martin a répondu à mes questions dans son courrier électronique du 25 août 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

MCM: "Je pense que le Web est un endroit idéal pour rapprocher les cultures et les personnes, et ceci inclut d'être multilingue. Notre site Travlang est très populaire pour cette raison, et les gens souhaitent se sentir en contact avec d'autres parties du monde."

ML: "Quel a été le bénéfice de l'utilisation d'Internet dans votre activité?"

MCM: "Et bien, nous en avons fait une petite affaire! Internet est vraiment un outil important pour communiquer avec des gens avec lesquels vous n'auriez pas l'occasion de dialoguer autrement. J'apprécie vraiment la collaboration générale qui a rendu possibles les pages de Foreign Languages for Travelers (Langues étrangères pour les voyageurs)."

ML: "Comment voyez-vous l'évolution vers un Internet multilingue?"

MCM: "Je pense que les traductions intégrales informatisées vont devenir monnaie courante, et qu'elles permettront de communiquer à la base avec davantage de gens. Ceci aidera aussi à amener davantage Internet au monde non anglophone."

La LINGUIST List est la section linguistique de la WWW Virtual Library. Elle donne une série complète de liens sur les ressources linguistiques: profession (conférences, associations linguistiques, programmes, etc.), recherche et soutien à la recherche (articles, résumés de mémoires, projets, bibliographies, dossiers, textes), publications, pédagogie, ressources linguistiques (langues, familles linguistiques, dictionnaires, information régionale), et soutien informatique (polices de caractères et logiciels).

Helen Dry, modératrice de la LINGUIST List, expliquait dans son courrier électronique du 18 août 1998:

"La LINGUIST List, que je modère, a pour politique d'accepter les informations dans toutes les langues, puisque c'est une liste pour linguistes. Nous ne souhaitons cependant pas que le message soit publié dans plusieurs langues, tout simplement à cause de la charge de travail que cela représenterait pour notre personnel de rédaction (nous ne sommes pas une liste fourre-tout, mais une liste modérée: avant d'être publié, chaque message est classé par nos étudiants-rédacteurs dans une section comprenant des messages du même type). Notre expérience nous montre que pratiquement tout le monde choisit de publier en anglais. Mais nous relions ces informations à un système de traduction qui présente nos pages dans cinq langues différentes. Ainsi un abonné ne lit LINGUIST en anglais que s'il le souhaite. Nous essayons aussi d'avoir au moins un étudiant-éditeur qui soit réellement multilingue, afin que les lecteurs puissent correspondre avec nous dans d'autres langues que l'anglais."

Géré par le Yamada Language Center de l'Université d'Oregon (USA), Yamada WWW Language Guides (Guides Yamada de langues sur le WWW) est un répertoire de ressources linguistiques par famille géographique et par ordre alphabétique. Il comprend des organismes, des écoles de langues, du matériel d'enseignement, des références culturelles, et des liens WWW.

Language today (La langue aujourd'hui) est un nouveau magazine pour ceux qui travaillent dans les langues appliquées: traducteurs, interprètes, terminologues, lexicographes et rédacteurs techniques. C'est une réalisation commune de Logos, qui procure le site web, et Praetorius, service d'expertise britannique qui suit l'actualité des développements concernant les langues appliquées. Le site procure des liens vers des associations de traducteurs, des écoles de langues et des dictionnaires.

Geoffrey Kingscott, directeur général de Praetorius, a répondu à mes questions dans son courrier électronique du 4 septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

GK: "Les caractéristiques propres au Web sont la multiplicité de générateurs de sites et le bas prix de l'émission de messages. Ceci favorisera donc le multilinguisme au fur et à mesure du développement du Web. Comme celui-ci a vu le jour aux Etats-Unis, il est encore principalement en anglais, mais ce n'est qu'un phénomène temporaire. Pour expliquer ceci plus en détail, je dirais que quand nous comptions sur l'imprimé ou l'audiovisuel (film, télévision, radio, vidéo, cassettes), l'information ou le divertissement que nous attendions dépendait d'agents (éditeurs, stations de télévision ou de radio, producteurs de cassettes ou de vidéos) qui devaient subsister commercialement et, dans le cas de la radiotélédiffusion du service public, avec de sévères contraintes budgétaires. Ceci signifie que la quantité de clients est primordiale, et détermine la nécessité de langues autres que l'omniprésent anglais. Ces contraintes disparaissent avec le Web. Pour ne donner qu'un exemple mineur tiré de notre expérience, nous publions la version imprimée de Language Today uniquement en anglais, dénominateur commun de nos lecteurs. Quand nous utilisons un article qui était originellement dans une langue autre que l'anglais, ou que nous relatons un entretien mené dans une langue autre que l'anglais, nous le traduisons en anglais et nous ne publions que la version anglaise, pour la raison suivante: le nombre de pages que nous pouvons imprimer est limité, et déterminé en fonction de notre clientèle (annonceurs et abonnés). Par contre, dans notre version Web, nous proposons aussi la version originale."

ML: "Quel a été le bénéfice de l'utilisation d'Internet dans votre activité?"

GK: "Internet n'a pas apporté de changement majeur dans notre société. C'est un médium de plus plutôt qu'un médium visant à remplacer les autres."

ML: "Quelle est l'évolution prévue dans les prochaines années?"

GK: "Nous continuerons d'avoir un site web pour notre société, et de publier une version de notre revue sur le Web, mais ceci ne sera qu'un secteur de notre travail. Nous utilisons Internet comme une source d'information que nous distillons ensuite à nos lecteurs, qui autrement seraient confrontés au problème majeur du Web: faire face à un flux incontrôlé d'informations."


3.2. Répertoires linguistiques

The Ethnologue est la version électronique deThe Ethnologue, 13e éd., (éditrice: Barbara F. Grimes, avec la collaboration de Richard S. Pittman and Joseph E. Grimes), publié en 1996 par le Summer Institute of Linguistics (Dallas, Texas, USA). Ce catalogue de plus de 6.700 langues parlées dans 228 pays est accessible au moyen de deux outils de recherche: le Ethnologue Name Index (Index des noms de l'Ethnologue), qui donne la liste des noms de langues et de dialectes et de leurs synonymes, et le Ethnologue Language Family Index (Index des familles linguistiques de l'Ethnologue), qui organise les langues en fonction des familles linguistiques.

Barbara F. Grimes, éditrice de The Ethnologue, écrivait dans son courrier électronique du 18 août 1998:

"Les pages web multilingues sont de plus en plus utiles, mais elles sont plus onéreuses à gérer. Nous avons eu des demandes nous demandant l'accès à The Ethnologue dans plusieurs autres langues, mais nous n'avons pas le personnel ni les fonds pour la traduction ou la réactualisation, indispensable puisque notre site est constamment mis à jour.

Internet nous est utile, c'est un outil pratique qui apporte un complément à notre travail. Nous l'utilisons principalement pour le courrier électronique.

C'est aussi un moyen commode pour mettre notre documentation à la disposition d'une audience plus large que celle de The Ethnologue imprimé.

D'un autre côté, The Ethnologue sur Internet n'atteint en fait qu'une audience limitée disposant d'ordinateurs. Or, dans les personnes que nous souhaitons atteindre, nombreux sont ceux qui n'ont pas accès à des ordinateurs. Je pense particulièrement aux habitants du dit 'Tiers-monde'."

Créé en décembre 1995 par Yoshi Mikami, de Asia Info Network , The Languages of the World by Computers and the Internet (Les langues du monde par ordinateur ou sur Internet), communément appelé Logos Home Page ou Kotoba Home Page, donne, pour chaque langue, un bref historique, les caractéristiques, le système d'écriture, le jeu de caractères et la configuration du clavier pour l'utilisation de l'ordinateur et d'Internet dans la langue donnée.

Dans son courrier électronique du 17 décembre 1998, Yoshi Mikami écrivait:

"Ma langue maternelle est le japonais. Comme j'ai suivi mes études de troisième cycle aux Etats-Unis et que j'ai travaillé dans l'informatique, je suis devenu bilingue japonais/anglais américain. J'ai toujours été intéressé par différentes langues et cultures, aussi j'ai appris le russe, le français et le chinois dans la foulée. A la fin de 1995, j'ai créé sur le Web The Languages of the World by Computers and the Internet et j'ai tenté de donner - en anglais et en japonais - un bref historique de toutes ces langues, ainsi que les caractéristiques propres à chaque langue et à sa phonétique. Suite à l'expérience acquise, j'ai invité mes deux associés à écrire un livre sur la conception, la création et la présentation de pages web multilingues, livre qui fut publié en août 1997 sous le titre: The Multilingual Web Guide (édition japonaise), le premier livre au monde sur un tel sujet.

Il y a des milliers d'années de cela, en Egypte, en Chine et ailleurs, les gens étaient plus sensibles au fait de communiquer leurs lois et leurs réflexions non seulement dans une langue mais dans plusieurs. Dans notre monde moderne, chaque Etat a adopté plus ou moins une seule langue de communication. A mon avis, Internet verra l'utilisation plus grande de langues différentes et de pages multilingues (et pas seulement une gravitation autour de l'anglais américain) et un usage plus créatif de la traduction informatique multilingue. 99% des sites web créés au Japon sont en japonais!"

Disponible sur le site de l'Institut Sabhal Mór Ostaig (Ile de Skye, Ecosse) et géré par Caoimhín P. Ó Donnaíle, European Minority Languages est une liste de langues minoritaires - ou rendues minoritaires - disponible par ordre alphabétique et par famille linguistique. Ce site procure aussi des liens avec des sites du même type dans le monde entier.

Caoimhín P. Ó Donnaíle écrivait dans son courrier électronique du 18 août 1998:

"Internet a contribué et contribuera au développement fulgurant de l'anglais comme langue mondiale.

Internet peut grandement aider les langues minoritaires. Ceci ne se fera pas tout seul, mais seulement si les gens choisissent de défendre une langue.

Le Web est très utile pour dispenser des cours de langues, et la demande est grande.

La norme UNICODE (ISO 10646) pour les jeux de caractères est très importante et elle va grandement favoriser le multilinguisme sur le Web."


3.3. Dictionnaires et glossaires

Les dictionnaires en ligne sont de plus en plus nombreux. Voici trois exemples (francophone, anglophone et multilingue).

Le Dictionnaire francophone en ligne, corpus lexical du Dictionnaire universel francophone, est publié conjointement par Hachette et l'Agence universitaire de la Francophonie (AUPELF-UREF), qui expliquent sur le site:

"Voici enfin présentés, sur un pied d'égalité, le français dit 'standard' et les mots et expressions en français tel qu'on le parle sur les cinq continents. Voici les termes de la flore et de la faune qui apportent vie et couleur à cet ouvrage. Ce dictionnaire s'adresse à tous ceux qui, à travers le monde, veulent voir dans la Francophonie une réalité que l'on désire qualifier de charnelle."

Dans Merriam-Webster Online: the Language Center (Merriam-Webster en ligne: le centre linguistique), un grand éditeur britannique de dictionnaires met en accès libre sa collection de ressources en ligne pour la langue anglaise: définition des mots, orthographe, prononciation, synonymes, exercices de vocabulaire, etc. Les ouvrages de référence disponibles en ligne sont le WWWebster Dictionary, le WWebster Thesaurus, le Webster's Third (lexique), le Guide to International Business Communications, le Vocabulary Builder (questions de vocabulaire interactives), et le Barnhart Dictionary Companion (nouveaux mots).

Le Logos Dictionary est un dictionnaire multilingue d'environ 8 millions d'entrées dans toutes les langues. Logos, une société de traduction internationale dont le siège est à Modène (Italie), met en accès libre les outils linguistiques utilisés par ses traducteurs: 200 traducteurs sur place, 2.500 traducteurs en ligne dans le monde, environ 200 textes traités quotidiennement. Outre le Logos Dictionary, ces outils comprennent la Wordtheque, une base de données multilingue de 325 millions de mots provenant de romans, documents techniques et textes traduits et présentés dans leur contexte, Linguistic Resources (Ressources linguistiques), qui regroupe 536 glossaires, et le Universal Conjugator (Conjugaison universelle), qui propose des tableaux de conjugaison dans 17 langues différentes.

Dans Les mots pour le dire, un article du quotidien Le Monde en date du 7 décembre 1997, Annie Kahn écrivait:

"Le site de Logos est beaucoup plus qu'un dictionnaire ou qu'un répertoire de liens vers d'autres dictionnaires en ligne. L'un des piliers du système est un logiciel de recherche documentaire fonctionnant sur un corpus de textes littéraires disponibles gratuitement sur Internet. Lorsque l'on recherche la définition ou la traduction d'un mot, 'didactique' par exemple, on trouve non seulement le résultat recherché, mais aussi une phrase d'une oeuvre littéraire utilisant ce mot (en l'occurence, un essai de Voltaire). Un simple clic permet d'accéder au texte intégral de l'oeuvre ou de commander le livre grâce à un partenariat avec Amazon.com, le libraire en ligne bien connu. Il en est de même avec les traductions étrangères. Si aucun texte utilisant ce mot n'a été trouvé, le système fonctionne alors comme un moteur de recherche et renvoie aux sites web concernant ce mot. Pour certains termes, il est proposé d'en entendre la prononciation. Si une traduction manque, le système fait un appel au peuple. A chacun d'enrichir la base, les traducteurs de l'entreprise valident ensuite les traductions proposées."

Logos a été créé par Rodrigo Vergara, un réfugié politique chilien qui a émigré en Italie quand il était étudiant en agronomie pour échapper au régime Pinochet. Aujourd'hui, à 45 ans, il dirige une entreprise de traduction offrant des services dans plus de 35 langues, avec un réseau de 300 traducteurs dans le monde et un chiffre d'affaires de 60 millions de FF.

Dans le même article, Rodrigo Vergara expliquait:

"Nous voulions que nos traducteurs aient tous accès aux mêmes outils de traduction. Nous les avons donc mis à leur disposition sur Internet, et tant qu'à faire nous avons ouvert le site au public. Cela nous a rendus très populaires, nous a fait beaucoup de publicité. L'opération a drainé vers nous de nombreux clients, mais aussi nous a permis d'étoffer notre réseau de traducteurs grâce aux contacts établis à la suite de cette initiative."

Les répertoires de dictionnaires sont des outils inappréciables pour les linguistes. Voici par exemple Dictionnaires électroniques, OneLook Dictionaries et A Web of Online Dictionaries.

Préparé par la Section française des Services linguistiques centraux (SLC-f) de la Chancellerie fédérale suisse, Dictionnaires électroniques est classé en cinq secteurs: dictionnaires monolingues, dictionnaires bilingues, dictionnaires multilingues, abréviations et acronymes, et informations géographiques.

Dans son courrier électronique du 14 janvier 1999, Marcel Grangier, responsable de cette section, répondait à mes questions.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

MG: "Le multilinguisme sur Internet peut être considéré comme une fatalité heureuse et surtout irréversible. C'est dans cette optique qu'il convient de creuser la tombe des rabat-joie dont le seul discours est de se plaindre d'une suprématie de l'anglais. Cette suprématie n'est pas un mal en soi, dans la mesure où elle résulte de réalités essentiellement statistiques (plus de PC par habitant, plus de locuteurs de cette langue, etc.). La riposte n'est pas de 'lutter contre l'anglais' et encore moins de s'en tenir à des jérémiades, mais de multiplier les sites en d'autres langues. Notons qu'en qualité de service de traduction, nous préconisons également le multilinguisme des sites eux-mêmes."

ML: "Quel a été le bénéfice de l'utilisation d'Internet dans votre activité?"

MG: "Travailler sans Internet est devenu tout simplement impossible: au-delà de tous les outils et commodités utilisés (messagerie électronique, consultation de la presse électronique, activités de services au profit de la profession des traducteurs). Internet reste pour nous une source indispensable et inépuisable d'informations dans ce que j'appellerais le 'secteur non structuré' de la toile. Pour illustrer le propos, lorsqu'aucun site comportant de l'information organisée ne fournit de réponse à un problème de traduction, les moteurs de recherche permettent dans la plus grande partie des cas de retrouver le chaînon manquant quelque part sur le réseau."

ML: "Comment voyez-vous l'évolution vers un Internet multilingue?"

MG: "La multiplication des langues présentes sur Internet est inévitable, et ne peut que bénéficier aux échanges multiculturels. Pour que ces échanges prennent place dans un environnement optimal, il convient encore de développer les outils qui amélioreront la compatibilité: la gestion complète des diacritiques ne constitue qu'un exemple de ce qui peut encore être entrepris."

Disponible depuis avril 1996, OneLook Dictionaries (Dictionnaires tous-dans-un), de Robert Ware, est un moteur de recherche rapide puisant dans plus de 2 millions de mots disponibles dans 425 dictionnaires traitant des domaines suivants: affaires, informatique/Internet, médecine, divers, religion, sciences, sports, technologie, généralités et argot.

Dans son courrier électronique du 2 septembre 1998, Robert Ware expliquait:

"A titre personnel, je suis presque uniquement en contact avec des gens qui ne pratiquent qu'une langue et qui n'ont pas beaucoup de motivation pour développer leurs aptitudes linguistiques. Etre en contact avec le monde entier change cette approche des choses. Et la change en mieux! [...] J'ai été long à inclure des dictionnaires non anglophones (en partie parce que je suis monolingue). Mais vous en trouverez maintenant quelques-uns."

Le Web of Online Dictionaries (Le Web des dictionnaires en ligne), de Robert Beard, est un index de plus de 800 dictionnaires en ligne dans 150 langues différentes, auquel s'ajoutent d'autres sections: dictionnaires multilingues, dictionnaires anglophones spécialisés, thésaurus et vocabulaires, grammaires en ligne, et outils linguistiques pour non spécialistes.

Robert Beard a répondu à mes questions dans son courrier électronique du 1er septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

RB: "On a d'abord craint que le Web représente un danger pour le multilinguisme, étant donné que le HTML [hypertext markup language] et d'autres langages de programmation sont basés sur l'anglais et qu'on trouve tout simplement plus de sites web en anglais que dans toute autre langue. Cependant, les sites web que je gère montrent que le multilinguisme est très présent et que le Web peut en fait permettre de préserver des langues menacées de disparition. Je propose maintenant des liens vers des dictionnaires dans 150 langues différentes et des grammaires en 65 langues différentes. De plus, comme ceux qui développent les navigateurs manifestent une attention nouvelle pour la diversité des langues dans le monde, ceci favorisera la présence de davantage encore de sites web dans différentes langues."

ML: "Quel a été le bénéfice de l'utilisation d'Internet dans votre vie professionnelle?"

RB: "En tant que professeur de langues, je pense que le Web présente une pléthore de nouvelles ressources disponibles dans la langue étudiée, de nouveaux instruments d'apprentissage (exercices interactifs Java et Shockwave) et de test, qui sont à la disposition des étudiants quand ceux-ci en ont le temps ou l'envie, 24 heures par jour et 7 jours par semaine. Aussi bien pour mes collègues que pour moi, et bien sûr pour notre établissement, Internet nous permet aussi de publier pratiquement sans limitation."

ML: "Comment voyez-vous l'évolution vers un Internet multilingue?"

RB: "Internet nous offrira tout le matériel pédagogique dont nous pouvons rêver, y compris des notes de lecture, exercices, tests, évaluations et exercices interactifs plus efficaces que par le passé parce que reposant davantage sur la notion de communication. Le Web sera une encyclopédie du monde faite par le monde pour le monde. Il n'y aura plus d'informations ni de connaissances utiles qui ne soient pas diponibles, si bien que l'obstacle principal à la compréhension internationale et interpersonnelle et au développement personnel et institutionnel sera levé. Il faudrait une imagination plus débordante que la mienne pour prédire l'effet de ce développement sur l'humanité."

Depuis 1995, à l'initiative du WorldWide Language Institute (Institut des langues du monde entier), NetGlos (The Multilingual Glossary of Internet Terminology) (Le glossaire multilingue de la terminologie d'Internet) est le projet commun d'un certain nombre de traducteurs et autres professionnels. Ce glossaire est préparé dans les langues suivantes: allemand, anglais, chinois, croatien, espagnol, français, grec, hébreu, hollandais/flamand, italien, maori, norvégien et portugais.

Brian King, directeur du WorldWide Language Institute, a répondu à mes questions dans son courrier électronique du 15 septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

BL: "Bien que l'anglais soit la langue la plus importante du Web et d'Internet en général, je pense que le multilinguisme fait inévitablement partie des futures orientations du cyberespace.

Voici quelques-uns des éléments qui, à mon sens, permettront que le Web multilingue devienne une réalité:

1. La popularisation de la technologie de l'information

La technologie des ordinateurs a longtemps été le seul domaine d'une élite 'technicienne', à l'aise à la fois dans des langages de programmation complexes et en anglais, la langue universelle des sciences et techniques. A l'origine, les ordinateurs n'ont jamais été conçus pour manier des systèmes d'écriture ne pouvant être traduits en ASCII. Il n'y avait pas de place pour autre chose que les 26 lettres de l'alphabet anglais dans un système de codage qui, à l'origine, ne pouvait même pas reconnaître les accents aigus et les trémas, sans parler de systèmes non alphabétiques comme le chinois.

Mais la tradition a été bouleversée, et la technologie popularisée. Des interfaces graphiques tels que Windows et Macintosh ont accéléré le processus. La stratégie de marketing de Microsoft a consisté à présenter son système d'exploitation comme facile à utiliser par le client moyen. A l'heure actuelle cette facilité d'utilisation s'est étendue au-delà du PC vers le réseau Internet, si bien que maintenant même ceux qui ne sont pas programmeurs peuvent insérer des applets Java dans leurs pages web sans comprendre une seule ligne de programmation.

2. La compétition des grandes sociétés pour une part de 'marché global'

L'extension de cette popularisation locale est l'exportation de la technologie de l'information dans le monde entier. La popularisation est maintenant effective à l'échelon mondial, et l'anglais n'est plus nécessairement la langue obligée de l'utilisateur. Il n'y a plus vraiment de langue indispensable, mais seulement les langues personnelles des utilisateurs. Une chose est certaine: il n'est plus nécessaire de comprendre l'anglais pour utiliser un ordinateur, de même qu'il n'est plus nécessaire d'avoir un diplôme d'informatique.

La demande des utilisateurs non anglophones et l'effort entrepris par les sociétés high-tech se faisant concurrence pour obtenir les marchés mondiaux a fait de la localisation un secteur en expansion rapide dans le développement des logiciels et du matériel. Le premier pas a été le passage de l'ASCII à l'ASCII étendu. Ceci signifie que les ordinateurs commençaient à reconnaître les accents et les symboles utilisés dans les variantes de l'alphabet anglais, symboles qui appartenaient le plus souvent aux langues européennes. Cependant une page ne pouvait être affichée qu'en une seule langue à la fois.

3. L'innovation technologique

L'innovation la plus récente est UNICODE. Bien qu'il soit encore en train d'évoluer et qu'il ait tout juste été incorporé dans les derniers logiciels, ce nouveau système de codage traduit chaque caractère en 16 octets. Alors que l'ASCII étendu à 8 octets pouvait prendre en compte un maximum de 256 caractères, UNICODE peut prendre en compte plus de 65.000 caractères uniques et il a donc la possibilité de traiter informatiquement tous les systèmes d'écriture du monde.

Les instruments sont maintenant plus ou moins en place. Ils ne sont pas encore parfaits, mais on peut désormais surfer sur le Web en utilisant le chinois, le japonais, le coréen, et de nombreuses autres langues qui n'utilisent pas l'alphabet occidental. Comme Internet s'étend à des parties du monde où l'anglais est très peu utilisé, par exemple la Chine, il est naturel que ce soit le chinois et non l'anglais qui soit utilisé. La majorité des usagers en Chine n'a pas d'autre choix que sa langue maternelle.

Une période intermédiaire précède bien sûr ce changement. Une grande partie de la terminologie technique disponible sur le Web n'est pas encore traduite dans d'autres langues. Et, comme nous nous en sommes rendus compte dans NetGlos, notre glossaire multilingue de la terminologie d'Internet, la traduction de ces termes n'est pas toujours facile. Avant qu'un nouveau terme ne soit accepté comme le terme correct, il y a une période d'instabilité avec plusieurs candidats en compétition. Souvent un terme emprunté à l'anglais est le point de départ et, dans de nombreux cas, il est aussi le point d'arrivée. Finalement émerge un vainqueur qui est ensuite utilisé aussi bien dans les dictionnaires techniques que dans le vocabulaire quotidien de l'usager non spécialiste. La dernière version de NetGlos est la version russe et elle devrait être disponible dans deux semaines environ [fin septembre 1998]. Elle sera sans nul doute un excellent exemple du processus dynamique en cours pour la russification de la terminologie du Web.

4. La démocratie linguistique

Dans un rapport de l'UNESCO du début des années 50, l'enseignement dispensé dans sa langue maternelle était considéré comme un droit fondamental de l'enfant. La possibilité de naviguer sur Internet dans sa langue maternelle pourrait bien être son équivalent à l'Age de l'information. Si Internet doit vraiment devenir le réseau mondial qu'on nous promet, tous les usagers devraient y avoir accès sans problème de langue. Le considérer comme la chasse gardée de ceux qui, par accident historique, nécessité pratique ou privilège politique, connaissent l'anglais, est injuste à l'égard de ceux qui ne connaissent pas cette langue.

5. Le commerce électronique

Bien qu'un Web multilingue soit souhaitable sur le plan moral et éthique, un tel idéal ne suffit pas pour en faire une réalité dépassant les limites actuelles. De même que l'utilisateur non anglophone peut maintenant avoir accès à la technologie dans sa propre langue, l'impact du commerce électronique peut constituer une force majeure qui fasse du multilinguisme la voie la plus naturelle vers le cyberespace.

Les vendeurs de produits et services dans le marché virtuel mondial que devient Internet doivent être préparés à faire face à un monde virtuel qui soit aussi multilingue que le monde physique. S'ils veulent réussir, ils doivent s'assurer qu'ils parlent bien la langue de leurs clients!"

ML: "Quel a été le bénéfice de l'utilisation du Web dans votre activité?"

BK: "Le principal service que nous offrons est l'enseignement des langues par le biais du Web. Notre organisme est dans la position unique d'en être venu à exister du fait d'Internet!"

ML: "Comment voyez-vous l'évolution vers un Internet multilingue?"

BK: "Comme l'existence de notre organisme est liée à l'importance attachée aux langues, je pense que son avenir sera excitant et stimulant. Mais il est impossible de pratiquer l'autosuffisance à l'égard de nos réussites et de nos réalisations. La technologie change à une allure frénétique. L'apprentissage durant toute la vie est une stratégie que nous devons tous adopter si nous voulons rester en tête et être compétitifs. C'est une tâche qui est déjà assez difficile dans un environnement anglophone. Si nous ajoutons à cela la complexité apportée par la communication dans un cyberespace multilingue et multiculturel, la tâche devient encore plus astreignante. Probablement plus encore que par le passé, la coopération est aussi indispensable que la concurrence.

Les germes d'une coopération par le biais d'Internet existent déjà. Notre projet NetGlos a dépendu du bon vouloir de traducteurs volontaires de nombreux pays: Canada, Etats-Unis, Autriche, Norvège, Belgique, Israël, Portugal, Russie, Grèce, Brésil, Nouvelle-Zélande, etc. Je pense que les centaines de visiteurs qui consultent quotidiennement les pages de NetGlos constituent un excellent témoignage du succès de ce type de relations de travail. Les relations de coopération s'accroîtront encore à l'avenir, mais pas nécessairement sur la base du volontariat."


3.4. Bases de données textuelles

Des bases de données textuelles sont accessibles par abonnement payant, par exemple FRANTEXT et l'ARTFL Project pour la langue française.

FRANTEXT, présent sur le Web depuis début 1995, est l'oeuvre de l'Institut national de la langue française (INaLF), une branche du CNRS (Centre national de la recherche scientifique, France). La base comprend, en mode interactif, 180 millions de mots-occurrences résultant du traitement informatique d'une collection représentative de 3.500 unités textuelles en arts, sciences et techniques couvrant cinq siècles (16e-20e siècles). Début 1998, 82 centres de recherche et bibliothèques universitaires d'Europe, d'Australie, du Japon et du Canada étaient abonnés, ce qui représentait 1.250 postes de travail ayant accès à la base. Le nombre de sessions d'interrogations était d'une cinquantaine par jour.

Dans son courrier électronique du 11 juin 1998, Arlette Attali indiquait les changements apportés par Internet dans sa vie professionnelle:

"Etant moi-même plus spécialement affectée au développement des bases textuelles à l'INaLF, j'ai été amenée à explorer les sites du Web qui proposaient des textes électroniques et à les 'tester'. Je me suis donc transformée en 'touriste textuelle' avec les bons et mauvais côtés de la chose. La tendance au zapping et au survol étant un danger permanent, il faut bien cibler ce que l'on cherche si l'on ne veut pas perdre son temps. La pratique du Web a totalement changé ma façon de travailler: mes recherches ne sont plus seulement livresques et donc d'accès limité, mais elles s'enrichissent de l'apport des textes électroniques accessibles sur Internet.

[A l'avenir je pense] contribuer à développer des outils linguistiques associés à la base FRANTEXT et à les faire connaître auprès des enseignants, des chercheurs, des étudiants et aussi des lycéens."

En janvier 1998, elle a mené une enquête auprès des utilisateurs de FRANTEXT pour mieux connaître ses utilisateurs. Les résultats de cette enquête sont disponibles en ligne.

L'ARTFL Project (ARTFL: American and French Research on the Treasury of the French Language - Recherche franco-américaine sur les trésors de la langue française) est un projet commun du Centre national de la recherche scientifique (CNRS, France) et de l'Université de Chicago (Illinois, USA), qui vise à constituer une base de données de 2.000 textes du 13e au 20e siècle concernant la littérature, la philosophie, les arts ou les sciences.

L'ARTFL travaille aussi à la version en ligne exhaustive de la première édition (1751-1772) de l'Encyclopédie ou Dictionnaire raisonné des sciences, des métiers et des arts de Diderot et d'Alembert. 72.000 articles écrits par plus de 140 collaborateurs (dont Voltaire, Rousseau, d'Alembert, Marmontel, d'Holbach, Turgot, etc.) ont fait de cette encyclopédie un monumental ouvrage de référence pour les arts et les sciences. Destinée à rassembler puis divulguer les connaissances de l'époque, elle porte la marque des courants intellectuels et sociaux du 18e siècle, et c'est grâce à elle qu'ont été propagées les idées du Siècle des Lumières.

Les chiffres sont éloquents quant à l'ampleur du travail: l'Encyclopédie comprend 17 volumes de texte et 11 volumes de planches, 18.000 pages de texte et 20.736.912 mots. La base de données correspondant au premier volume est accessible en ligne à titre expérimental. La recherche peut être effectuée par mot, portion de texte, auteur ou catégorie, ou par la combinaison de ces critères entre eux. On dispose de renvois d'un article à l'autre, et des liens permettent d'aller d'une planche au texte, ou du texte au fac-similé des pages originales. L'automatisation complète des procédures de saisie a entraîné quelques erreurs typographiques et des erreurs d'identification qui seront corrigées plus tard. La recherche d'images par mot, portion de texte ou catégorie sera également possible à l'avenir.

L'ARTFL travaille aussi à un projet de base de données pour le Dictionnaire de l'Académie française, dont les différentes éditions se sont échelonnées entre 1694 et 1935. Ce projet inclut la saisie et l'édition du texte, ainsi que le développement d'un moteur de recherche spécifique. Les différentes éditions pourront être combinées dans une seule base de données qui permettra de consulter aussi bien une édition particulière que l'ensemble de celles-ci pour juger de l'évolution d'un terme. Pour le moment, seules deux éditions, la première (1694) et la cinquième (1798), sont disponibles pour une recherche par mot. Une fonction de recherche en texte intégral est prévue par la suite.

Une rubrique présente une liste des autres projets de l'ARTFL, notamment la version image de l'édition de 1740 du Dictionnaire historique et critique de Philippe Bayle, le Roget's Thesaurus de 1911, le Webster's Revised Unabridged Dictionary de 1913, le Thresor de la langue française de Jean Nicot (1606), un projet multilingue sur La Bible comprenant La Bible française de Louis Segond (1910), etc.

De par la quantité d'oeuvres dactylographiées à cette intention, le Project Gutenberg est la plus ancienne et la plus grande cyberbibliothèque qui existe. Créée en 1971 par Michael Hart aux Etats-Unis, elle a pour but de mettre gratuitement le plus grand nombre possible de textes à la disposition du plus grand nombre possible de lecteurs, à raison d'environ 45 titres par mois. Ses objectifs pour 2001 sont un stock de 10.000 textes littéraires et une transmission de 1.000 milliards de textes électroniques, soit 10.000 livres numériques vers 100 millions de lecteurs.

Le projet débuta en 1971 quand on donna à Michael Hart un compte de 100 millions de dollars de "temps machine" au Materials Research Lab de l'Université d'Illinois (USA). Immédiatement après avoir reçu ce crédit, il décida de le consacrer à la recherche et au stockage des oeuvres conservées dans les bibliothèques. Il décida aussi de stocker des textes électroniques de la manière la plus simple possible, en format ASCII, avec des lettres capitales pour les termes en italique, gras ou soulignés, afin que ces textes puissent être lus quels que soient la machine et le logiciel utilisés.

Cinquante heures environ sont nécessaires pour sélectionner, dactylographier, corriger et mettre en page un texte électronique. La dactylographie des textes est l'oeuvre de volontaires. Un ouvrage de taille moyenne - par exemple un roman de Stendhal ou de Jules Verne - est composé de deux fichiers ASCII.

Le Project Gutenberg inclut trois grands secteurs: la littérature de divertissement (Light Literature), comme Alice au pays des merveilles, Peter Pan ou les Fables d'Esope, la littérature "sérieuse" (Heavy Literature) comme La Bible, les oeuvres de Shakespeare ou Moby Dick, et la littérature de référence (Reference Literature), composée d'encyclopédies et de dictionnaires, par exemple le Thesaurus de Roget.

Sur le site web, Michael Hart explique que la collection de littérature de divertissement est destinée à amener devant l'écran aussi bien un enfant d'âge pré-scolaire qu'une personne du troisième âge. Des enfants ou des grand-parents vont rechercher le texte électronique de Peter Pan après avoir vu Hook au cinéma, ou bien ils lisent Alice au pays des merveilles après l'avoir regardé à la télévision. Pratiquement tous les épisodes de Star Trek ont mentionné des livres qui ont leur correspondant électronique dans le Project Gutenberg (Moby Dick, Peter Pan...). L'objectif est que les gens puissent retrouver des citations qu'ils ont entendues dans des conversations, des films, des musiques, d'autres livres, et ce à l'aide d'une bibliothèque contenant tous ces éléments dans un format facile pour la recherche.

En juillet 1997, le Projet Gutenberg fêtait son vingt-sixième anniversaire avec la mise en ligne des Merry Adventures of Robin Hood de Howard Pyle. En septembre 1997, il fêtait son millième texte électronique avec la version anglaise de la Divine comédie de Dante. Dans sa lettre d'information d'octobre 1997, Michael Hart annonçait son intention de compléter la collection d'Oscar Wilde, de "séparer" les oeuvres complètes de Shakespeare en fichiers individuels pour chaque oeuvre, et de mettre en ligne des ouvrages non anglophones.

Outre l'anglais, on trouve quelques oeuvres en allemand, espagnol, français, italien et latin, mais elles ne sont pas encore légion. En janvier 1998, si on lançait une recherche sur les ouvrages disponibles en langue française, on trouvait neuf titres, dont six romans de Stendhal (L'Abbesse de Castro, La Chartreuse de Parme, La Duchesse de Palliano, Le Rouge et le Noir, Les Cenci, Vittoria Accorambani), deux romans de Jules Verne (De la terre à la lune et Le tour du monde en 80 jours) et French Cave Paintings, un ouvrage sur les peintures préhistoriques. A part ce dernier ouvrage, disponible depuis 1995, tous ces ouvrages n'ont été intégrés à la bibliothèque que début 1997. Si aucun titre de Stendhal n'était disponible en anglais, il existait trois oeuvres de Jules Verne dans cete langue: 20,000 Leagues Under the Sea (disponible depuis septembre 1994), Around the World in 80 Days (disponible depuis janvier 1994) et From the Earth to the Moon (disponible depuis septembre 1993).

Début septembre 1998, le nombre de titres d'ouvrages en langue française était monté à onze, avec Cyrano de Bergerac, d'Edmond Rostand, disponible depuis mars 1998, et La Révolution française, de Thomas Carlyle, disponible depuis mai 1998.

La lettre d'information d'octobre 1997 annonçait le développement des collections étrangères du Projet Gutenberg. Dans celle de mars 1998, Michael Hart indiquait que les volontaires du projet préparaient maintenant des textes électroniques en allemand, espagnol, français et portugais. Ces prochains mois, il espérait aussi recevoir des textes dans les langues suivantes: arabe, catalan, chinois, coréen, danois, espéranto, grec, hébreu, hollandais, hongrois, italien, japonais, latin, lituanien, polonais, roumain, russe, slovaque et slovène.


3.5. Bases de données terminologiques

La consultation gratuite sur le Web de bases terminologiques est très appréciée des linguistes. Voici par exemple quatre bases terminologiques gérées par des organisations internationales: Eurodicautom, géré par le Service de traduction de la Commission européenne, ILOTERM, géré par l'Organisation internationale du Travail (OIT), TERMITE (Base de données terminologique des Télécommunications de l'UIT), géré par l'Union internationale des télécommunications (UIT) et WHOTERM (WHO Terminology Information System), géré par l'Organisation mondiale de la santé (OMS).

Eurodicautom est la base de terminologie multilingue préparée par le Service de traduction de la Commission européenne. Mise en place à l'origine pour aider les traducteurs de la Commission, elle est consultée aujourd'hui par un nombre croissant de fonctionnaires de l'Union européenne autres que des traducteurs, ainsi que par des professionnels des langues dans le monde entier. Constamment mise à jour, cette base est disponible dans douze langues: allemand, anglais, danois, espagnol, finnois, grec, hollandais, italien, latin, portugais et suédois, et elle couvre de nombreux sujets.

ILOTERM est une base de données terminologique quadrilingue (allemand, anglais, espagnol et français) qui est gérée par l'Unité de terminologie et de références du Service des documents officiels (OFFDOC) de l'Organisation internationale du Travail (OIT). Comme l'indique le site web,

"sa principale finalité est d'apporter des solutions, conformes à l'usage courant, à des problèmes terminologiques dans le domaine du travail et des questions sociales. Les termes figurent en anglais avec leurs équivalents en français, espagnol et/ou allemand. La base de données contient également (dans une à quatre langues) des articles concernant la structure et les programmes de l'OIT, les noms officiels d'institutions internationales, d'organismes nationaux et d'organisations nationales d'employeurs et de travailleurs, ainsi que les titres de réunions et d'instruments internationaux."

Géré par la section de traduction de l'Union internationale des télécommunications (UIT), TERMITE (Base de données terminologique des Télécommunications de l'UIT) est également quadrilingue (anglais, espagnol, français et russe).

"TERMITE contient tous les termes qui apparaissent dans tous les glossaires de l'UIT imprimés depuis 1980, ainsi que des termes plus récents en rapport avec les différentes activités de l'Union (en tout quelques 59.000 entrées). Normalement les collaborateurs qui s'occupent de l'amélioration et de la mise à jour de cete base de données sont des traducteurs ou des éditeurs techniques. TERMITE est surtout visité par les traducteurs internes mais aussi par des utilisateurs externes, travaillant dans le domaine des télécommunications."

Géré par l'Organisation mondiale de la santé (OMS), le système d'information terminologique WHOTERM (WHO Terminology Information System) est trilingue (anglais, espagnol et français). Il est constitué à partir des expressions et concepts des documents de l'OMS afin d'"améliorer la rigueur et la cohérence des textes rédigés, préparés ou traduits. Il permet également à tous ceux qui collaborent à des programmes techniques de l'OMS d'enrichir les terminologies nouvelles, de promouvoir leur normalisation et de garantir leur diffusion."


Chapitre 4: traduction
Table des matières


Le multilinguisme sur le Web
Page d'accueil du Livre 010101
Page d'accueil du NEF


© 1999 Marie Lebert