Les Groupes, Répertoire et Web (par mots clés) de Google: quelques stratégies pour rechercher des documents consacrés à la linguistique française en-ligne

Snejina Sonina

University of Toronto

Octobre 2002
© 2002 Snejina Sonina

 
[Nota. Les sites reliés s'affichent dans une deuxième fenêtre pour permettre la lecture parallèle des deux niveaux, commentaire et commenté.]

Pour trouver des sites consacrés à la linguistique française j’ai essayé d’utiliser des moteurs de recherche différents, y compris le moteur Fabula spécialisé sur les études françaises, mais à l'évidence le moteur général Google donne de bien meilleurs résultats.

Ci-dessous je décris les stratégies des recherches que j’ai essayées avec Google et qui se sont montrées efficaces pour trouver des sites en français de la qualité appropriée. Dans la plupart des cas j’utilise ici l’exemple d’un seul domaine de la linguistique – la lexicologie.

1. Outils offerts par le moteur

Pour commencer il faut essayer d’utiliser les services spécialisés que le moteur nous offre, tels que groupes et répertoire, où les sites sont déjà classés selon leur contenu:

1.1. Groupes

Cet outil offre un classement des groupes de discussion en français, mais ne se montre pas très utile pour la recherche en linguistique (je n’ai pas trouvé de groupes sérieux) malgré le fait qu'il offre quelques liens intéressants (le signe ">" veut dire que le site a été trouvé à partir du site précédent):

Google: Groupes http://www.google.ca/grphp?q=&ie=ISO-8859-1&hl=fr
> Groupe: fr. lettres. langue http://groups.google.ca/groups?hl=fr&lr=&ie=UTF-8&group=fr.lettres.langue
> Groupe: fr. lettres. langue. francaise http://groups.google.ca/groups?hl=fr&lr=&ie=UTF-8&group=fr.lettres.langue.francaise

dont :
> Langue française http://www.langue-fr.net/
> Marges linguistiques http://www.marges-linguistiques.com/

1.2. Répertoire

L’utilisation de cette offre de Google, qui permet la recherche limitée à la catégorie, amène à une bonne sélection des sites en linguistique avec de courtes annotations, ce qui simplifie la continuation de la recherche.

Google: Répertoire: Sciences humaines et sociales http://directory.google.com/Top/World/Fran%C3%A7ais/Sciences/Sciences_humaines_et_sociales/
Linguistique (62 documents) http://directory.google.com/Top/World/Fran%C3%A7ais/Sciences/Sciences_humaines_et_sociales/Linguistique/

Cela vaut la peine de visiter tous les sites proposés dans cette liste en faisant attention aux liens qu’ils offrent, puisque même des pages d’accueil des universités peuvent procurer de l’information importante, comme par exemple le site du Département Linguistique de l’Université de Genève. <http://www.unige.ch/lettres/linge/>
Ce site offre des liens vers les publications en-ligne du Laboratoire de traitement automatique du langage (LATL) <http://www.latl.unige.ch/> et vers les sites de deux revues linguistiques dont l'une est électronique : les Cahiers de linguistique française (CLF) <http://www.unige.ch/lettres/linge/moeschler/CLF/> et la revue électronique GG@G (Generative Grammar in Geneva) <http://www.unige.ch/lettres/linge/syntaxe/fr/journal/journal.html>.

On ne perd pas beaucoup de temps pour comprendre que groupes ne donnent pas grand-chose puisque le lien vers la revue Marges linguistiques, seule trouvaille valable, figure dans la liste proposée par répertoire aussi. Donc, si on ne s’intéresse pas particulièrement aux groupes de discussion, le service répertoire suffit. Cependant, cet outil peut rendre service seulement pour une recherche sur un sujet assez large, comme Linguistique en général. Pour chercher des sites plus particuliers consacrés aux domaines spécialisés de la linguistique il faut utiliser d’autres stratégies de recherche.

Il faut remarquer que l’utilisation des outils en anglais donne des résultats différents comme, par exemple, directory, qui offre presque 100 fois plus de résultats pour Linguistics que répertoire pour Linguistique.

Google: Directory: Social Sciences http://directory.google.com/Top/Science/Social_Sciences/
> Language and Linguistics (5977) http://directory.google.com/Top/Science/Social_Sciences/Language_and_Linguistics/

2. Fenêtre magique du moteur: recherche par mots clés (Google: option Web)

Les stratégies de recherche de sites nécessaires à l’aide de la fenêtre principale du moteur sont, en fait, des stratégies pour le choix adéquat des mots à taper dans cette fenêtre, les "mots clés". Ce choix doit permettre, d’un côté de trouver le plus de sites recherchés possible, de l’autre côté, d’éviter le plus de sites indésirables. Cela veut dire que les mots choisis doivent en même temps limiter la recherche et la placer dans le contexte nécessaire. Les combinaisons des stratégies énumérées ci-dessous du choix des mots peuvent aider à effectuer cette double tâche. Il faut noter que les recherches énumérées ci-dessous sous 2.1, 2.2 et 2.10 ont été faites à travers le Web général et n'ont pas été limitées aux Pages francophones; les autres concernent les seules Pages francophones.

2.1. Stratégie 1

Demander à chercher des mots français à un moteur de recherche sans choisir la langue de recherche. Des mots épelés à la française doivent bien limiter la recherche puisqu’en tout cas le moteur ne trouve les mots recherchés que dans les matériaux français sans exclure des sites dont la langue principale n’est pas française (cf. le site French Language: French Lexicology, sous 2.2). Cependant l’orthographe seule n’aide pas beaucoup puisque le nombre des résultats reçus à l’aide de Google est toujours énorme quand il s’agit de termes généraux :

Google général (résultats du 4 octobre)
Recherche : linguistics - 1.540.000 résultats.
Recherche : linguistique  -  335.000 résultats.
Recherche : linguistique française - 98.600 résultats.
Recherche : lexicologie  - 10.500 résultats.

D'après ces résultats, il est évidant que le mot français linguistique est presque 5 fois plus rare que le mot anglais linguistics ainsi que le mot lexicologie est plus de 30 fois plus spécifique que le mot linguistique, mais pas suffisamment. Il faut donc combiner quelques mots français pour obtenir un nombre de résultats plus réduit.

2.2. Stratégie 2

Placer un mot français assez spécifique dans le contexte qui intéresse le chercheur en ajoutant des mots (même plus généraux) décrivant ce contexte.

Google général (4 octobre)
Recherche : linguistique française lexicologie – 2.570 résultats

Le résultat précédent (lexicologie - 10.500 résultats) est immédiatement réduit de presque 5 fois. Ce nombre semble plus abordable. La visite de quelques-uns des premiers sites proposés par Google donne des résultats bien utiles:

1. http://www.uibk.ac.at/c/c6/c611/Oehri.html : Lexikologie / Neologie. Ce site en allemand (le "title" html donne habilement l'orthographe française lexicologie) propose de bonnes URL, comme :
> http://www.linguistes.com/mots/morpheme.html : Monèmes, morphèmes et lexèmes
> http://www.linguistes.com/mots/mot.html : La notion de mot
> http://www.linguistes.com/mots/lexique.html : Études du lexique
Et qui sont  produits par Henriette Gezundhajt, SELF, Université de Toronto, 1997-2000
> http://french.about.com/cs/lexicologiefrana/ : French Language: French Lexicology. Celui-ci offre "Links to resources related to the study of words".

2. http://www.ciep.fr/doc/index.htm : CIEP. Ce site se destine à l'intégration de l'informatique dans l'enseignement du français.

Des revues, accessibles par le classement thématique :

3. http://www.cilf.org/bm.fr.html : La Banque des mots. Revue de terminologie française.

4. http://ancilla.unice.fr/~brunet/pub/sommaire.html : Le Français en Afrique. N° 13 - 1999. Revue du Réseau des Observatoires du Français Contemporain en Afrique.

Un annuaire + moteur de recherche :

5. http://www.dicorama.com/ : Dicorama est à la fois un annuaire des dictionnaires et un moteur de recherche permettant de chercher un terme dans plus de 670 dictionnaires (2.891.019 termes indexés).

Un logiciel de recherche documentaire et statistique :

6. http://ancilla.unice.fr/~brunet/pub/hyperbase.html : Hyperbase ("Le logiciel Hyperbase est un hypertexte, destiné aux recherches documentaires et statistiques.").

2.3. Stratégie 3

Concentrer des mots décrivant les domaines spécifiques de la discipline en question dans une seule recherche. Cette astuce doit ne procurer que des sites qui invoquent tous les domaines linguistiques en laissant ceux qui ne concernent qu’un domaine non pertinent pour la recherche. Donc, elle doit permettre de trouver les sites linguistiques français les plus importants.

Google francophone (23 septembre)
Recherche : lexicologie phonologie morphologie syntaxe - 541 résultats.
Recherche : lexicologie phonologie morphologie syntaxe sémantique - 427 résultats.

Évidemment, plus il y a de mots moins il y a de résultats et les sites retrouvés sont plus complets. Exemples :

1. http://qsilver.queensu.ca/french/Cours/215/index.html : FREN 215: Introduction à la linguistique française. Ce site de Queen’s University at Kingston contient textes + exercices :
Chapitre 1: Concepts de base / Chapitre 2: La phonétique / Chapitre 3: La phonologie / Chapitre 4: La morphologie / Chapitre 5: La morphologie dérivationnelle / Chapitre 6: La lexicologie / Chapitre 7: La syntaxe / Chapitre 8: La sémantique

2. http://qsilver.queensu.ca/french/Cours/215/chap6.html#6.1 : Chapitre 6: La lexicologie

2.4. Stratégie 4

Placer les mêmes noms de domaines dans le contexte de la linguistique française en ajoutant le mot « française » pour éviter des sites consacrés à l'étude d’autres langues.

Google francophone (23 septembre)
Recherche : lexicologie phonologie morphologie syntaxe sémantique langue française – 323 résultats.
Recherche : lexicologie phonologie morphologie syntaxe sémantique linguistique française – 333 résultats.

J’ai supposé que le mot linguistique, étant plus spécifique que le mot langue, réussirait à limiter la recherche encore mieux mais ce changement n’a changé presque rien ni dans la quantité ni dans la qualité des résultats. En fait, les deux mots n’ont pas beaucoup d’importance.

Recherche : lexicologie phonologie morphologie syntaxe sémantique française – 335 résultats.

2.5. Stratégie 5

Utiliser le signe « - » pour exclure des contextes indésirables, comme par exemple, la simple énumération des disciplines citées ci-dessus dans les programmes des universités différentes.

Google francophone (23 septembre)
Recherche : lexicologie phonologie morphologie syntaxe sémantique linguistique française -programme - 186 résultats.

Il est possible de voir clairement quels mots il faut introduire dans la recherche avec le signe « - » après avoir visité les 10 premiers sites des environ 300 obtenus dans la recherche décrite sous la rubrique 2.4. On reçoit les mêmes sites importants sans énumération des disciplines dans les programmes universitaires.

2.6. Stratégie 6

Combiner les noms des domaines les plus proches de la discipline en ne pas oubliant d’utiliser le signe « - » pour éliminer des sites indésirables.

Google francophone (6 octobre)
Recherche : lexicologie lexicographie française - 688 résultats.
Recherche : lexicologie lexicographie française -programme -cours - 217 résultats.
Recherche : lexicologie terminologie française -programme -cours - 251 résultats.

Dont :

1. http://www.aelum.umontreal.ca/liens.html : AELUM. Page qui offre des liens vers les departements de linguistique et les sites des revues, dont
> http://semlab2.sbs.sunysb.edu/Language/language.html (adresse obsolète) > http://www.lsadc.org/language/ Language (site informationnel sans textes)

2. http://www.cfwb.be/franca/termin/liste.htm : Les cahiers du Rifal. "Consulter la revue en ligne. Les numéros disponibles en ligne se lisent à l'aide du logiciel Acrobat Reader"
> http://www.cfwb.be/franca/termin/charger/rint20.pdf : N° 20, décembre 1999 : "Nouveaux outils pour la néologie"

Cette stratégie permet de trouver des sites plus spécifiques, concentrés seulement sur les domaines en question, qui n’apparaissent pas au cours de la recherche générale décrite sous 2.4. et 2.5.

2.7. Stratégie 7

Utiliser le nom d’un savant renommé dans le domaine plus le nom du domaine.

Google francophone (23 septembre)
Recherche : lexicologie française Rey - 357 résultats.
Recherche : lexicologie saussure française -programme -cours - 60 résultats.

Parmi les résultats obtenus pour Rey (en l'occurrence Alain, mais aussi J. Rey-Debove), plusieurs bibliographies, dont :

1. http://users.skynet.be/sky37816/Langf.html : "Langue française". Bibliographie bien structurée élaborée par Jean-Pierre Lacroux

2. http://perso.respublica.fr/fabyanaa/bibliofm.htm : "Bibliographie – français moderne"

3. http://www-bu.bibu.u-cergy.fr/Culture/musee_dictionnaire/bibliographie/bibliographie2.htm : "Bibliographie chronologique d'ouvrages des domaines de la lexicologie, lexicographie, dictionnairique et métalexicographie" (par J. Pruvost)

4. http://www.chass.utoronto.ca/~wulfric/edicta/wooldridge/deb_bib.htm : "Les Débuts de la lexicographie française: Bibliographie". Bibliographie importante
> http://www.chass.utoronto.ca/~wulfric/nicot/ : "Jean Nicot, Thresor de la Langue Françoyse". Documents précieux pour ceux qui s’intéressent à l’histoire de la langue

Parmi les résultats pour Saussure :

1. http://www.chass.utoronto.ca/epc/langueXIX/cabanes/index.html : "Le Dictionnaire Logique de la Langue Française d'Élie Blanc: Images, analogies et pathologie de la langue française au XIXe siècle" (par Jacques-Philippe Saint-Gérand)

2. http://www.unil.ch/BCU/recherches/disciplines/linguistique/revues.htm : "Bibliothèque cantonale et universitaire de Lausanne: Linguistique – Revues"
> http://www.unil.ch/BCU/recherches/disciplines/linguistique/revues.htm#ligne : "Revues de linguistique accessibles en ligne"

3. http://www.msh-reseau.prd.fr/RevuesSom/parrevue.jsp?Arevue=%22C%22 : "Maison des Sciences de l'Homme: Liste des revues par ordre alphabétique" (lettre C). 176 revues.

4. http://perso.club-internet.fr/akrieg/lireliste.html : "lire". Résumés et comptes rendus des travaux d'Alice Krieg.

2.8. Stratégie 8

Utiliser le nom d’un domaine spécifique de la discipline plus un terme répandu dans ce domaine tout en étant typiquement scientifique. Cela permet d’éliminer la plupart des sites sans valeur linguistique où le nom de ce domaine est seulement mentionné et de trouver des pages qui contiennent des textes exposant des études dans le domaine.

Google francophone (23 septembre)
Recherche : lexicologie lexème française - 107 résultats.

Le mot lexème limite le mot lexicologie presque 100 fois (Cf. avec les résultats sous 2.1.)

Recherche : lexicologie lexème française homonymie - 21 résultats.
Recherche : lexicologie française homonymie - 90 résultats.

Ces résultats donnent beaucoup d’articles de revues en-ligne (surtout en format pdf) :

1. http://www.erudit.org/erudit/meta/v45n03/messaou/messaou.pdf  Meta. 45/3 : "Opacité et transparence dans les technolectes bilingues (français-arabe)"

2. http://www.erudit.org/erudit/meta/v46n04/perceboi/perceboi.pdf : Meta. 46/4 : "Fonction et vie des sigles et achronymes"

3. http://www.termisti.refer.org/faintro.htm : "Mille faux amis en langue française". Introduction. [par] Marc Van Campenhoudt. ISTI : Centre de recherche TERMISTI & Section de langue française

4. http://www.termisti.refer.org/crtt.pdf : [Id.] "De la lexicographie spécialisée à la terminographie"

5. http://zeus.fltr.ucl.ac.be/recherche/publications/pub_cill.html : Cahiers de l'Institut de Linguistique de Louvain. Énumération des publications de la revue.

2.9. Stratégie 9

Couper l’adresse retrouvé au cours des recherches précédentes à l’endroit logique pour trouver la page d’accueil.

Par exemple l’adresse <http://www.termisti.refer.org/faintro.htm> ("Mille faux amis en langue française") peut être coupée :
http://www.termisti.refer.org/ : TERMISTI. Centre de recherche en terminologie. Le lien "L'inforoute francophone" renvoie à
> http://www.refer.org/ : AUF. Multi F Contact. Ce dernier site propose des liens à 11 disciplines dans sa Bibliothèque en ligne, laquelle donne 12 rubriques sous Sciences du langage, dont :

http://www.bibliotheque.refer.org/livre2/l2.htm : Visages du français : variétés lexicales de l’espace francophone, AUF/JLE – 1990

2.10. Stratégie 10

Ajouter le mot « liens », ou « accès en ligne »  au nom du domaine de la linguistique accompagné des mots plaçant le recherche dans le contexte linguistique.

Google général (22 septembre)
Recherche : lexicologie française liens - 636 résultats dont plusieurs sont très utiles.
Recherche : lexicologie française accès en-ligne - 282 résultats dont plusieurs sont très utiles, comme cette page des "Signets de la BnF: Langue française".