Google GlossaryRusson WooldridgeUniversity of Toronto
Juin 2003 |
|
Google Glossary est un outil en voie de développement qui ne fonctionne pour l'instant que pour les documents en anglais. Son fonctionnement n'est pas expliqué sur le site, mais on peut induire des résultats qu'il livre que l'outil recherche des pages qui portent dans leur intitulé le terme de glossary ou équivalent.
Les exemples offerts sur la page de requête de Google Glossary sont "lymph node, DMZ, packet sniffer, photon, da capo, aqua regia, sunk cost, perihelion, albedo, CORBA, sensitivity, retailing, flow chart, Holi, Jini, fiber, dark fibre, kVA, ADSL, syzygy, Montreal Protocol, EBITDA sunk cost, vitreous humor, vegemite, Shinto, MPAA, Pocket PC, DTP, COGS" d'où on devine qu'il s'agit surtout de glossaires techniques, ce qui correspond en fait à la plupart des glossaires en ligne, qui traitent de "lexique[s] d'un domaine spécialisé. Glossaire de génétique" (Le Petit Robert).
Dans ce qui suit, nous allons faire un essai de l'outil en prenant comme termes cobayes des mots anglais dont l'orthographe varie, en l'occurrence quelques mots généralement considérés comme caractéristiques des deux grandes variantes de l'anglais : l'anglais britannique et l'anglais américain. Soit quelques mots relevant des paradigmes -re vs. -er et -our vs. -or. Si on considère souvent que centre, theatre, colour et humour sont britanniques, et que center, theater, color et humor sont américains, on se rend vite compte que dans les faits les frontières sont brouillées, qu'il s'agisse de textes papier (romans ou journaux, par exemple) ou de textes en ligne.
Il n'est donc pas question ici de caractériser les documents du Web d'après leur éventuelle appartenance à l'une ou à l'autre de ces deux variantes de l'anglais, mais d'une part de montrer qu'on a intérêt à tenir compte de variantes orthographiques si on veut tirer le maximum de l'outil et d'autre part d'examiner les types de définitions et de glossaires consultés (à la date du 24 juin 2003).
N° d'ordre | Intitulés de pages | Entrée précédente et entrée suivante |
---|---|---|
center 1 | "Glossary" cf. page hiérarchiquement supérieure http://www.unige.ch/ses/sococ/eda/ : "Exploratory Data Analysis. This home page contains links to pages related to Eugene Horber's activities in the field of Exploratory Data Analysis, graphical data analysis, data mining [...]" | Casid Coding |
center 2 | "APPLIED TECHNOLOGY EDUCATION. Definitions" | Budget failure Municipality |
center 3 | Lien mort. Malgré l'adresse ([...] /NapaValley/Vineyard/2333/definitions.html), il s'agirait de définitions dictionnairiques de mots de la langue générale | |
center 4 | Lien qui renvoie ailleurs. Adresse = [...] www.superbowl-bettinglines.com/glossary.htm ; il s'agirait d'un glossaire de la terminologie du football américain | |
center 5 | Le <title> html du document indique "HTML Definitions" | Width Blinking |
center 6 | "Executive Flight Training School. Glossary of Terms" | CEILING CERTIFICATED AIRPORT |
center 7 | Lien mort. L'adresse ([...] /webline/tags.htm) suggère qu'il s'agit de définitions de commandes HTML, comme dans le n° 5 | |
centre 1 | "DICTIONARY OF PHILOSOPHY AND PSYCHOLOGY" | Central Centre of Mass or Gravity |
centre 2 | Lien mort. La définition et l'adresse ([...] www.research.ibm.com/deepblue/reference/html/i.2.c.html) indiquent qu'il s'agirait d'un glossaire de termes échiquéens |
En résumé, le mot center/centre est défini dans le Web comme terme d'analyse de données exploratoires, d'éducation en technologies appliquées, de football américain, de codage HTML, de formation en pilotage aéronautique, de philosophie-psychologie et comme terme d'échecs, aussi bien que comme mot de la langue générale. Ce qui n'exclut pas, bien entendu, que le mot soit défini autrement dans des pages non repérées par Google Glossary.
N° d'ordre | Intitulés de pages | Entrée précédente et entrée suivante |
---|---|---|
color 1 | <title> html : "Glossary of Pokémon TCG Terms" | collecting card game combo |
color 2 | Lien mort. La définition indique qu'il s'agit d'une terminologie de balisage électronique | |
color 3 | Lien mort. Même chose que pour le n° 2 : la définition indique qu'il s'agit d'une terminologie de balisage électronique | |
color 4 | "Apparel Search Glossary" | coldcut color management |
color 5 | "Diamond Glossary" | Clarity Enhancements Color Enhancements |
color 6 | <title> html : "glossary" ; intitulé de page : "TERMS USED IN THE DESCRIPTION OF WOOD" | [rien avant] FIGURE |
color 7 | "Color Terms" | [rien avant] Hue |
color 8 | <title> html : "Image Reproduction 7 Steps - Glossary" | CMYK Color accuracy |
color 9 | Lien mort. La définition indiquerait qu'il s'agit d'un glossaire technique du livre | |
colour 1 | Lien mort. La définition est assez générale, mais l'adresse ([...] /glosstech.htm) montre qu'il s'agirait d'un glossaire technique | |
colour 2 | <title> html : "Glossary" ; page index : "A glossary of common remote sensing terms" | CNES Colour composite |
colour 3 | Lien mort. La définition et l'adresse indiquent qu'il s'agit d'un glossaire de termes concernant la qualité de l'eau | |
colour 4 | Lien mort. La définition et l'adresse indiquent qu'il s'agit d'un glossaire de termes concernant l'impression ou le tirage de photographies |
Bilan : quasiment toutes des définitions de procédés techniques.
N° d'ordre | Intitulés de pages | Entrée précédente et entrée suivante |
---|---|---|
humor 1 | Lien mort. Il ne s'agit pas d'une définition dans le sens métalinguistique du terme, mais plutôt d'une définition discursive donnée dans une page non technique (pleine de fautes d'orthographe) : "A genuine sence of humor is havein a light touch:not beating reality into the ground but apprecieating reality with a light touch." | |
humor 2 | "#cuseemesex glossary" | Hung Humour |
humor 3 | "Caspak Glossary" (univers créé par Edgar Rice Burroughs) | horse huts, Kro-lu |
humor 4 | "Glossary of Conscious Creation Terms" | God (All-That-Is/Universal Whole/Tao/Suchness/Gnosis/Wholeness) Imagination |
humor 5 | <title> html : "Funny Definitions & Word Humor - Jokes, Riddles & Cartoons" | Pas d'entrée mais plusieurs liens tels que "Automotive & Driving Humor" |
humor 6 | "Polyamory Society Glossary" | Humankind Husband |
humor 7 | <title> html : "WWWF Glossary", Le premier article nous apprend que WWWF veut dire "World Wide Web Fights" | Grudge Match, Da Book {also (tm) and (TM)} |
humor 8 | <title> html : "The Webby Awards: Judging: Category Definitions" | Health Kids |
humour 1 | "DICTIONARY OF PHILOSOPHY AND PSYCHOLOGY" | Humility Hutcheson, Francis |
humour 2 | "Arnold's Glossary of Anatomy" | humerus hyaline |
humour 3 | "Metaphorical Definitions" | Hope Joy |
humour 4 | "#cuseemesex glossary" | Humor Impostor |
Synthèse : surtout domaine du ludique et du fantastique, mais on note la présence de deux définitions techniques pour la forme humour.
N° d'ordre | Intitulés de pages | Entrée précédente et entrée suivante |
---|---|---|
theater 1 | "BLUE vs GRAY: THE CIVIL WAR CARD GAME. GLOSSARY OF TERMS" | target city tokens |
theater 2 | Lien mort. La définition et l'adresse indiquent qu'il s'agit d'un glossaire de termes de guerre | |
theater 3 | "Appendix to the San Juan Capistrano Municipal Code: DEFINITIONS" | Terrace, slope Townhouse |
theater 4 | "TRADEMARKS AND NAMES. Definitions" | Run Trade screening |
theater 5 | Lien mort. La définition et l'adresse indiquent qu'il s'agit d'un glossaire de termes concernant la civilisation romaine | |
theater 6 | Lien mort. La définition et l'adresse indiquent qu'il s'agit d'un glossaire militaire | |
theater 7 | "USIGS Glossary". La page index nous apprend que USIGS signifie "UNITED STATES IMAGERY AND GEOSPATIAL INFORMATION SERVICE" | The Open Group Theater Mission Planning System |
theater 8 | Lien mort. La définition, comme l'adresse, suggère qu'il s'agit d'un glossaire militaire | |
theater 9 | <title> html : "roulette glossary of experimental music" | straight experimental totalism |
theatre 1 | "Fine Arts Curriculum Standards. THEATRE GLOSSARY" | Text Theatre Arts |
theatre 2 | <title> html : "Glossary of Landscape Gardening and Architecture Terms" | tetrastyle tonsure |
En bref : la graphie theater donne surtout des définitions militaires, alors que les sens dramatiques (spectacle et lieu) et topographique sont mieux définis par la forme theatre.