L'importance des sources informatiques dans l'étude de la terminologie de la mode: la liste exhaustive, aujourd'hui et il y a vingt ans

Snejina Sonina

University of Toronto


Introduction

Une recherche terminologique suppose la création d'une liste exhaustive des termes à étudier. Il y a vingt ans ces termes devaient être extraits manuellement d'un corpus des écrits déterminé par le chercheur. Le livre de Robert Galisson Recherches de lexicologie descriptive: la banalisation lexicale (Paris: Nathan, 1978) est un exemple excellent de cette méthode. On peut toujours procéder de la même façon mais de nouvelles technologies informatiques incitent à essayer de trouver de nouvelles méthodes qui seraient plus efficaces que l'extraction manuelle.

Il serait donc très intéressant et très utile de voir jusqu'à quel point la liste des termes extraits de l'Internet peut-elle être considérée comme exhaustive. Il y a des raisons linguistiques et celles techniques pour faire la tentative de relever les termes en-ligne. Les raisons linguistiques concernent des pratiques d’usage :

Les raisons techniques portent sur des pratiques de recherche – de nouvelles technologies devraient faciliter le travail du dépouillement et permettre de dépouiller un plus grand nombre de sources terminologiques :

1. Phénomène de banalisation lexicale

1.1. Terminologie "banalisée"

On utilisera le concept du langage « banalisé » proposé par Robert Galisson pour formuler la notion de la terminologie « banalisée. » Si on entend par un langage « banalisé » « un langage second, greffée sur un langage « technique » (ou scientifique, professionnel, spécialisé), pour assurer une diffusion plus large aux informations relevant du domaine d'expérience couvert par le langage technique en question. » (Galisson, 9), on entendra, donc, par terminologie "banalisée" une terminologie seconde, « greffée » sur une terminologie spécialisée des professionnels et constituant une base linguistique du langage qui sert à assurer une diffusion plus large des informations de son domaine d'expérience. C'est surtout le caractère systématique de la terminologie qui la distingue du langage dans lequel elle est utilisée.

1.2. Terminologie "banalisée" de la mode

La terminologie de la mode vestimentaire peut être représentée comme un signe complexe dont le signifié est le système des notions du domaine de la mode et dont le signifiant est l’inventaire linguistique décrivant ce domaine.

Si cet inventaire linguistique est technique on parle de la terminologie spécialisée de la mode qui est à la base du langage technique utilisé par des spécialistes – créateurs de la mode ou des articles vestimentaires.

Si cet inventaire est « banalisé » on parle de la terminologie vestimentaire « banalisée » qui sert de la base du langage banalisé utilisé par les journalistes qui décrivent les événements dans le monde de la mode et qui en font la publicité, aussi bien que par des vendeurs et des consommateurs des articles vestimentaires.

1.3. Forme des langages de la mode

La forme de ces deux langages peut être orale et écrite. Il est difficile d'attribuer à chacun de ces langages une forme typique comme Galisson l'a fait pour le langage technique et celui banalisé du football. Le langage technique est utilisé dans le travail des professionnels de la mode sous sa forme orale, mais aussi dans de nombreux manuels de fashion design et dans la documentation technique des sociétés fabricantes sous sa forme écrite. Le langage banalisé est représenté dans des catalogues, dans des revues de mode, sur des enseignes sous sa forme écrite, mais aussi dans des télé- ou radio émissions, dans les commentaires des défilés, et dans les conversations des vendeurs et des consommateurs sous sa forme orale.

La forme « électronique » semble être propre surtout au langage banalisé. Cette forme se rapproche le plus de la forme écrite quand il s'agit des catalogues ou des articles en ligne. Quand-même, elle a des traits en commun avec la forme orale quand il s'agit des home-pages, des groupes de discussion et des annonces privées où l'expression semble être assez spontanée et peu normalisée.

C'est cette dernière forme du langage banalisé de la mode qui est en question dans la présente recherche.

2. Méthode d’investigation

2.1. Matériel à étudier

2.1.1. Sources

On disposait toujours de beaucoup de sources pour analyser le langage banalisé de la mode et pour en extraire l'inventaire terminologique en question : des encyclopédies et des dictionnaires de la mode; la presse écrite et orale; des catalogues de vente; des guides et des inscriptions utilisées dans les grands magasins; les conversations. Ces dernières années en ont ajouté encore une – l'Internet.

Les avantages de la presse écrite (facile à collecter, n'est pas soumise à l'image), qui ont déterminé le choix de Galisson, semblent être ternis par la brillance de ceux promis par l'Internet. Celui-ci permet l'accessibilité immédiate d'un grand nombre de documents divers; rend la collecte des textes nécessaires plus facile que jamais; propose les textes en version électronique facile à manipuler; peut faire une analyse approximative de la fréquence de chaque terme. Un tel miracle devrait sûrement avoir ses côtés négatifs. C'est pour mesurer ces avantages par rapport à ces désavantages qu'on s'est proposé d'utiliser l'Internet comme la source unique des termes vestimentaires.

Une seule branche du domaine de la mode – les chaussures – a été choisie pour essayer d'élaborer une méthode de relèvement de termes basée sur l'exploration de l'Internet. Cette expérimentation visait à répondre à deux questions principales :

2.1.2. Corpus exhaustif

Le corpus exhaustif électronique pour l'étude de la terminologie française banalisée du domaine de la chaussure devrait être représenté par tous les sites Web à un moment donné (1 – 10 avril) sur lesquels des termes français désignant des chaussures sont mentionnés. Puisque l'Internet offre simultanément des sites créés aux moments différents et dans des pays divers on devrait contourner le problème de la période de publication et de provenance qui existait pour la presse écrite dans la recherche de Galisson dont le corpus exhaustif devait embrasser les publications de tous les pays francophones d'une période déterminée comme représentative.

2.2. Échantillonnage

Le corpus exhaustif décrit ci-dessus ne semble pas être possible à examiner : le 10 avril 2000 Altavista a trouvé 21 496 pages, où le mot « chaussure » était mentionné (891 765 pages pour le mot « shoes »). Conséquemment, le corpus-échantillon s'impose comme pour l'analyse des données de la presse écrite de Galisson. En suivant ce bon exemple, le corpus d'échantillon serait constitué de deux parties : corpus échantillon de base et corpus échantillon de saturation.

2.2.1. Échantillon de base

2.2.1.1. Aspects qualitatifs du choix de sources

Pour déterminer l'échantillon de base il faudrait trouver des sources capables de fournir des informations concentrées sur le domaine étudié. Telles sources devraient être consacrées entièrement aux chaussures ou traiter celles-ci dans le contexte de la mode vestimentaire. Tous les sites francophones ou bilingues ayant ces qualités et étant accessibles du premier au dix avril 2000 pourraient constituer l'échantillon de base pour la liste exhaustive des termes « chaussuriens » français.

2.2.1.2. Recherche des sites appropriés pour l'échantillon de base

Pour trouver des sites de la qualité appropriée on peut procéder différemment : ci-dessous on décrit les méthodes qu'on a essayées et qui se sont montrées efficaces pour trouver des sites en français qui donnent des descriptions des chaussures convenables pour créer le corpus-échantillon, en commençant par la méthode la plus simple :

  1. Demander à chercher le mot « chaussure » à un moteur de recherche qui ne permet pas de choisir la langue de recherche. Un mot étranger limite la recherche tout seul. Le moteur qui n'est pas spécialisé dans la recherche sur les pages françaises ne trouve le mot recherché que dans les matériaux bilingues qui sont très nécessaires pour ce travail. Comme résultat, le 5 avril Yahoo a trouvé seulement 4 pages ou, en fait, deux répétées chacune deux fois :
  2. Yahoo! Site Matches (1 - 4 of 4)

    Business and Economy > Companies > Apparel > Footwear > Boots > Brand Names

    Les Chaussures Régence Inc. - manufacturer of winter boots.

    Business and Economy > Companies > Apparel > Footwear > Retail

    Chaussures Tony Inc. - brand name footwear for the whole family, in a selection of sizes and widths.

    Un de ces sites Chaussures Tony  s'est trouvé vraiment merveilleux pour cette recherche : on y trouvait des catalogues de vente bilingues de différentes sociétés productrices des chaussures. L'autre Les Chaussures Régence ne représentait que des chaussures d'hiver et était en français ou en anglais au choix, donc s'est montré très utile aussi.

    En utilisant cette méthode on a trouvé du bon matériel mais pas suffisant, donc on continuerait.

  3. Demander à chercher le mot « chaussure » à un moteur de recherche qui ne permet pas de choisir la langue, mais qui propose le choix du domaine de recherche et ce domaine peut être celui de la mode. Dans cette méthode aussi, le mot étranger sert à limiter encore plus la recherche. Fashion thematic Search en Voila a donné 208 résultats pour le mot « shoes » et il n'en a proposé que 14 pour le mot « chaussure. » De ces 14 propositions, après avoir éliminé des doubles et des cites aux sujets trop étroit comme Dance world, dance shoe,...  ou  Claude Montana site officiel , et après avoir visité les autres en utilisant la fonction Highlight Keyword, il n'en est resté que 2 : une revue de mode en ligne ANATOMIQUE ARCHIVES (plutôt un de ses numéros consacré aux chaussures) et un site IMAGIRL.COM proposant des liens hyper-textuels avec des sites réservés aux chaussures dont les cinq, au premier coup d'oeil, pouvaient être utiles pour la présente recherche en promettant de l'information en français et, donc, méritaient une visite. Les cinq visites ont apporté de très bonnes trouvailles : trois catalogues de chaussure en ligne :  Jean Thiot ; le Palais de la Chaussure (téléchargeable), Ernest (téléchargeable).
  4. Il semble être utile de dire quelques mots sur les sites inutilisables pour la création de l'échantillon de base terminologique. Ce sont des sites qui n'offrent que des images des produits sans descriptions et ceux qui exposent des images et des textes qui bougent et qui sont impossibles à copier ni à imprimer pourtant ces derniers peuvent être consultés pour la vérification des données. Il y a aussi des sites qui offrent une description, mais sans nommer la chaussure, dans ces cas on a une image et une description qui n'aide pas beaucoup à étudier la terminologie :

    http://www.shoppinginternet.com/

    Couleur : Pleine fleur Bleu

    Talon : Compensé

    Cuir dessus : Pleine fleur

    Doublure : Pleine fleur

    Demi-première : Pleine fleur

  5. Pour les moteurs de recherche qui permettent de choisir la langue de recherche on est obligé de la limiter en utilisant le signe « + » : l'élimination des pages où le mot « chaussure » est mentionné comme partie d'une description donne des résultats modestes. Altavista a trouvé 14 pages en français pour « chaussure+mode » et seulement 2 pour « chaussure+catalogue. » Les deux catalogues ont été dépouillés immédiatement. Les 14 pages proposées pour « chaussures+mode » ont été visitées. Le meilleur résultat de ces 14 visites était le site Chaussure de France qui proposait l'information sur les 62 « sites Internet sur la chaussure. » De ses 62 sites 12 se sont montré relevants pour la création du corpus échantillon pour la terminologie française en question.

  6. On peut obtenir de bon résultats en demandant à un moteur à chercher le nom d'une société française de vente par correspondance bien connue. Bien sûr, on peut toujours essayer quelque chose comme « redoute.com » « laredoute.com » « redoute.fr » mais en utilisant un moteur de recherche on trouve normalement d'autres informations relevantes. C'est comme ça que les catalogues en ligne de Damart, de La Redoute et de Trois Suisses ont été trouvés. En cherchant « Redoute+catalogue » on est tombé sur le site Planetboutique (http://www.planetboutique.com/produits/vetements/vetements.htm ) qui avait des liens avec une dizaine d'autres catalogues de vente de prêt-à-porter qui pourraient être consultés lors de la continuation du travail sur la mode vestimentaire et dont les cinq vendaient des chaussures. Une seule tentative de recherche « Redoute+catalogue » a permis de trouver les trois catalogues nommés ci-dessus et encore deux - Cyrillus et Decathlon - dont on ignorait l’existence. L'avantage de travail avec ces catalogues est le fait qu'ils ont leurs moteurs de recherche à eux qui permettent de retrouver tout de suite toute information relevante en choisissant, ou en tapant, le mot « chaussure » dans la fenêtre « vous recherchez » du moteur. En plus les catalogues proposent souvent le classement des articles qui fait ressortir des termes génériques, par exemple, le Cyrillus propose un mini-catalogue comme réponse à la demande « chaussure » et « femme » :

    En exploitant ces quatre méthodes, on a dû reconnaître que des catalogues de vente en ligne représentaient sûrement le corpus le plus concentré (Galisson, 41) qui couvre le mieux le domaine de la mode « chaussurienne » : ils ne donnent que des informations qui sont en rapport direct avec les chaussures.

    Quand-même, le mini-sommaire « chaussure » de Cyrillus cité ci-dessus, révèle un problème important pour les recherches terminologiques sur l'Internet dans le domaine de la mode : le caractère saisonnier des informations figurant en ligne à un moment donné. Évidemment, si on fait le browsing du Net au mois d'avril, on ne découvre que des versions « printemps – été » de la plupart des catalogues. Pour équilibrer les données on donnait la préférence aux catalogues qui ne font pas la distinction de saison et on a inclus des catalogues des sociétés fabricantes de bottes et des chaussures pour les sports d'hiver. Les recherches entreprises spécialement pour enrichir la partie « chaussure d'hiver » de l'échantillon n'ont pas abouti aux changements révolutionnaires : Altavista propose 5 847 pages pour « botte » et 6 965 pour « bottine »; la recherche limitée par thematic search en Voila et par d'autres mots fréquents dans les catalogues et revues de modes - « +mode », « +chaussure » ou « +cuir » - ramène aux sites déjà explorés et aux sites publicitaires des cordonniers ou des sociétés qui ne font pas de présentations de leurs modèles. De cette expérience on a tiré la conclusion que pour les recherches lexicologiques dans les domaine qui dépendent des saisons il faut entreprendre des recherches sur le Net autant de fois que la quantité de saisons impose. Pour le domaine de la mode deux fois par ans au moins – en printemps et en automne – pour consulter les collections « printemps – été » et « automne – hiver » et pour être sûr d'avoir englobé tous les termes de toutes les saisons.

    Si l'étape suivante : interrogation du TACT sur la fréquence des termes « botte - bottine - bottillon » dans les documents électroniques dépouillés est trop basse, il vaut mieux parler d'un échantillon pour le sous-domaine « chaussure printemps – été » et attendre l'automne pour en créer la deuxième moitié « chaussure automne – hiver. »

    2.2.1.3. Aspects quantitatifs du choix des sources

    Finalement, on a choisi 20 sites principaux qui pourraient constituer l'échantillon de base pour le sous-domaine « chaussure » de la terminologie française de la mode. Dans ces 20 sites tous les catalogues retrouvés ont été inclus comme procurant les informations les plus concentrées sur les chaussures - des descriptions de différents modèles. Conséquemment, les cent pages du journal de travail extraites de ce corpus à l'aide de la méthode copy-paste devraient représenter le matériel suffisant pour entamer l'étude de la terminologie en question. Quand-même, dans les cas douteux, il faudrait bien s'adresser au corpus que Galisson caractériserait comme dilué sur des descriptions « vagues et innombrables » – les moteurs de recherche de l'Internet devraient être vraiment nécessaires à cette étape. Sans existence de ces outils on serait obligé de se limiter au corpus concentré sur des descriptions « précises et dénombrables » comme Galisson l'avait fait, il y a vingt ans. Ce sont les sources du corpus « dilué » qui devraient constituer l'échantillon de saturation qui servirait à vérifier et à enrichir les résultats obtenus par le dépouillement du corpus « concentré » de base.

    La quantité de nouvelles sources à examiner ne pourrait pas être déterminée d'avance. On ne pouvait dire que pour chaque terme générique relevé au cours du dépouillement de l'échantillon de base on interrogerait trois moteurs de recherche, tels que Altavista, Voilà et Yahoo, comme cela avait été fait pour le verbe québécois « enfirouapper » par Russon Wooldrige et al. Tous les sites traitant la chaussure dans le contexte de la mode vestimentaire qui seraient découverts pendant cette deuxième enquête constitueraient l'échantillon de contrôle. Tous les nouveaux contextes et groupes de mots serviront à préciser l'arbre terminologique de chaque terme générique.

    2.2.1.4. Aspects quantitatifs des résultats de l'échantillon de base – la liste des fréquences

    Le document de cent pages des descriptions extraites du corpus échantillon a été traité par un logiciels d’indexation et d’interrogation interactive des données textuelles - TACT. Le résultat de ce traitement était la liste des fréquences des termes qui a beaucoup facilité le travail du dépouillement et qui a démontré pour chaque terme sa présence quantitative dans l'échantillon de base.

    Les cent pages de descriptions en vrac ont été transformées par TACT en cent cinquante pages sur lesquelles les termes ont été présentés comme une longue colonne dont la partie supérieure est citée ci-dessous

    Techniquement le travail de dépouillement a été réduit au tri de cette colonne en utilisant cut pour éliminer les mots qui n'appartenaient pas au domaine de la chaussure, et en utilisant tab-key pour arranger des colonnes thématiques des termes. Ces simples opérations ont permis de recevoir de la liste générale citée ci-dessus cinq colonnes de cinq listes thématiques citées ci-dessous.

    On a pris note des prépositions les plus fréquents dans la liste - 486 de ; 125 pour ; 89 avec ; 55 du ; 35 par. Ces prépositions pourraient servir à établir des modèles de formation des termes, par exemple, la préposition « avec » n'étant pas la plus répandue dans le langage commun à une fréquence élevée dans le corpus échantillon parce que dans le langage de la mode elle est basique pour le modèle typique N'+avec+N « mule avec bride. » Pourquoi ne pas envisager la liste des fréquence des modèles?

    On a marqué par des points d'interrogation des termes qui pouvaient poser des problèmes d'interprétation (adjectif « simple » qui pouvait être caractéristique de la chaussure ou de son détail; termes génériques « boot » « mocassin » « derby » dont la haute fréquence venait sûrement des contextes anglais copiés involontairement des catalogues bilingues avec des descriptions françaises)  pour les résoudre à l'aide de TACT qui permettrait d'analyser les cooccurrences de ces termes dans l'échantillon de base ou à l'aide de l'échantillon de saturation.

    Les termes peu fréquents, les groupes nominaux terminologique et les anglicismes ont normalement besoin de la confirmation de leur statut terminologique. Un des critères les plus importants pour confirmer ce statut est la fréquence d'occurrence. Il y a dix ans il était nécessaire de redépouiller des catalogues, des revues et des journaux pour déterminer la fréquence d'occurrence d'un terme. L'interrogation des moteurs de recherche de l'Internet et des bases de données permet de voir la fréquence de l'occurrence d'un terme en ligne immédiatement, et dans la plupart des cas cette information est suffisante pour considérer une unité lexicale comme terminologique et très profitable pour enrichir l'échantillon de saturation de son terme générique.

    Il faut ajouter, que les données de la liste de la fréquence ont démontré des chiffres assez élevés pour les termes désignant des chaussures d'hiver qu'on estimait comme mal représentées pendant la saison printemps – été : bottes – 39, botte – 33 (Cf. sandales – 60, sandale – 43). Ces chiffres permettaient de reconnaître le corpus échantillon de base comme valable pour les chaussures d'hiver. Toutefois, les même chiffres étant inférieurs par rapport à ceux des « sandales » montraient qu'il faudrait se rendre compte de la saison pour élaborer l'échantillon de saturation pour les termes génériques désignant les chaussures d'hiver.

    La liste des termes génériques extraite de l'échantillon de base servirait de point de départ pour la création de l'échantillon de saturation.

    2.2.2. Échantillon de saturation

    L'échantillon de saturation dans la méthode de Galisson était nécessaire pour s'assurer de la quasi-exhaustivité de la liste des termes reçue de l'échantillon de base. Dans cette méthode « électronique » cet échantillon pourrait être constitué, d'une part, des sources électroniques qui ont été trouvées au cours de la création de l'échantillon de base sans y être inclues, et d'autre part des sources relevées pendant des recherches complémentaires des documents confirmant ou enrichissant des informations sur la distribution et la fréquence des termes génériques.

    Avant tout, il faudrait entreprendre des recherches spéciales sur le Net pour les termes génériques peu fréquents (2 « brodequin ») et ceux qui ont reçu un point d'interrogation dans la liste thématique des termes génériques.

    Finalement, chaque terme générique devrait avoir son propre échantillon de saturation créé à l'aide de l'exploitation des trois moteurs de recherche et basé sur le matériél « dilué » sur des descriptions vagues et indéfinies. L'ensemble de ces échantillons de saturation « individuels » constituerait le corpus de l'échantillon de saturation de la présente recherche.

    2.2.2.1. Échantillon de saturation d'un terme particulier

    Pour le terme peu fréquent « brodequin » Altavista (limité French) a trouvé 54 pages, Voila – 36 pages, Yahoo – 35 pages le 14 avril. Ces pages pouvaient être divisées en quatre catégories principales : 1) des sites consacrés à la chaussure; 2) des dictionnaires en-ligne; 3) des sites culte heavy metal; 4) des textes littéraires.

    1) Les sites consacrés à la chaussure ont mis le début de la liste des sites pour l'échantillon général de control parce qu'ils pouvaient contenir des informations relevantes pour d'autres types de chaussure.

    Deux entre eux représentaient des entreprises productrices des chaussures de sécurité dont les catalogues ne pouvaient pas être inclus dans l'échantillon de base comme trop spécialisés mais qui peuvent être utiliser pour préciser les contextes de termes particuliers. La société Lemaitre citait « brodequin » comme un des type des produits :

    Quand-même, parmi ces types il n'y avait pas de modèles spéciales de brodequin, sauf

    2) Les données des dictionnaires ont été copiés pour préciser le concept de la chaussure désignée par le terme « brodequin », cependant, puisque ce sont des dictionnaires plutôt « historique » ils ne peuvent préciser que le concept historique du terme du dix-septième siècle et de l’antiquité :

    3) Les sites des Death Metal Bands ont été pris en compte pour le futur travail sur la terminologie anglaise : le terme "brodequin" s'est trouvé manifestant une connotation 'vêtement culte' dans la langue anglaise.

    Cette connotation anglaise semble avoir influencé le terme français aussi, au moins à Montréal:

    4) Les textes littéraires devraient servir à préciser et enrichir les contextes contemporains du terme et apporter du matériel très important pour la future recherche en diachronie – des sources premières d'autres époques.

    Tous ces renseignements réunis, on peut confirmer le statut terminologique du mot « brodequin » vu le nombre suffisant de ses occurrences, mais on ne peut pas le considérer comme générique vu son emploi trop spécial : il n'est générique que dans le domaine des chaussures de sécurité qui ne fait pas partie du système terminologique banalisé. Ce terme semble survivre à son déclin – il est en train d'obtenir le statut d'un mot historique, spécialisé, ou culte. Dans le langage de mode d'aujourd'hui il désigne plutôt un modèle spécial de bottine lacée qu'un type de chaussure. Les occurrences comme « Chaussure montante type brodequin » ou « des chaussures à brodequin » confirme son statut du terme désignant un modèle concret de chaussure.

    2.2.2.2. Échantillon de contrôle

    Tous les sites consacrés à la chaussure découverts au cours de la création de l'échantillon de saturation pour chaque terme générique constitueraient le corpus de l'échantillon de contrôle, ainsi que les sites qui avaient été trouvés pendant l'élaboration de l'échantillon de base mais n'y avaient pas été inclus comme « trop étroits. » L'interrogation par TACT de ce dernier corpus devrait mettre le point dans la création de la liste électronique exhaustive des termes « chaussuriens. » Il est presque impossible que ses « derniers » sources ajoutent grand-chose aux informations extraites de deux corpus principales, mais, cependant, il est possible qu'elles puissent apporter quelques nouvelles distributions des termes. Ce serait, donc, cet échantillon de contrôle qui jouerait le rôle que l'échantillon de saturation avait joué dans la recherche de Galisson.

    2.2.2.3. Corpus complémentaires

    Au cours de la construction de l'échantillon de saturation deux corpus complémentaires ont été constitués : corpus historique et corpus anglais. Les deux corpus seront nécessaires pour la future recherche comparative et diachronique. Corpus anglais servira en plus à préciser le système terminologique de la chaussure au niveau « profond » des notions. Si chaque terme français pouvait avoir un terme anglais correspondant ce serait un système idéal. En réalité, il est tout à fait possible qu'il y ait des lacunes dans les deux terminologies « superficielles » qui ne peuvent être remarquées qu'au cours d'une études comparative.

    Conclusion

    La tentative de la création de la liste exhaustive des termes entreprise sur l'exemple du domaine de la chaussure a confirmé la grande utilité de l'Internet pour les recherches en terminologie banalisé. La commercialisation des réseaux a rendu un grand service pour la présente recherche : les catalogues de vente en ligne se sont démontrés comme des sources concentrées sur les descriptions des chaussures et comme telles ont formé le matériel le plus représentatif et commode à exploiter.

    L'apport de l'Internet s'est trouvé précieux pour des raisons qui avaient été évidentes des le début de cette expérimentation  - les données les plus récentes, la possibilité d'interroger des sources de nature diverse en même temps – mais aussi à cause des trouvailles inattendues faites « chemin faisant », surtout, au cours de la création de l'échantillon de saturation pour chaque terme. Ces trouvailles ont amené à la création de deux corpus complémentaires – historique et anglais – qui seront indispensables pour la recherche terminologique dont la base des données a été commencée par cette expérimentation.

    Du point de vue technique le travail de la création de la liste des termes est apparu facile et fascinant grâce à l'aide des moteurs de recherche et de TACT : celui-ci effectuant un tri du matériel retrouvé en le présentant comme une liste commode à manipuler; ceux-là proposant des réponses abondantes aux questions posés, permettant un accès immédiat aux sources, procurant le matériel sous sa forme électronique qui permettait de le copier directement dans le file du corpus et de le traiter par TACT tel quel.

    Les côtés négatifs de la recherche électronique semblent être plutôt techniques que conceptuels : les sites qui ne s'ouvrent pas ou qui disparaissent, ceux qui existent mais ne peuvent pas être utilisés comme les sources électroniques (sites qui bougent ne permettant pas d’utiliser copy-paste méthode) ou comme les sources de l'information terminologique (sites qui n'offrent que de belles images sans descriptions). Quand-même, la quantité des sites employés semble être suffisante pour créer une liste des termes couvrant le domaine de la chaussure.

    Au cours de cette expérimentation une nouvelle méthode de la constitution de la liste exhaustive des termes pour une terminologie banalisée a été élaborée. Cette méthode basée sur celle de Robert Galisson crée il y a vingt ans diffère de son prototype à cause de la forme du matériel exploité (documents électroniques au lieu de la presse écrite) et à cause de la nature différente de la terminologie étudiée (la terminologie vestimentaire est constituée essentiellement des noms référentiels qui peuvent être facilement systématisés au niveau des notions pour en dégager les termes génériques). La particularité de la terminologie vestimentaire et la forme électronique du matériel ont permis de structurer différemment l'échantillon de saturation – ce n'est plus un échantillon ayant la même nature que celui de base comme dans le modèle de Galisson – mais un ensemble de plusieurs « échantillons de saturations » créés pour chaque terme générique séparément. Cette structure de l'échantillon de saturation permet de mieux juger le rôle de chaque terme générique dans le contexte terminologique et d'enrichir ces contextes grâce au recours aux sources de la nature différente, y compris les sources « dilué » sur des descriptions n'étant pas en rapport direct avec la mode – ce genre de sources Galisson ne pouvait pas les utiliser il y a vingt ans. Le rôle du corpus de la vérification de la plénitude des données reçues est joué dans le nouveau modèle par l'échantillon de contrôle qui correspond dans ce sens à l'échantillon de saturation de Galisson. Pour cette première expérimentation le deuxième échantillon de contrôle s'impose – celui constitué de catalogues « sur papier » pour comparer la plénitude des données électroniques avec celles « imprimées. » Néanmoins, si le dépouillement du premier grand catalogue imprimé n'ajoute presque rien de nouveau à la liste reçue des sources électroniques, la continuation de ce travail de vérification n'aura pas de sens, la liste « électronique » devra être reconnue quasi exhaustive. Sinon, la liste « électronique » a constitué la base solide et facile à être complétée par des données d'autres sources pour en faire la liste quasi exhaustive de la terminologie de la chaussure.