Analyse des résultats d'une recherche dans le WWW
+montaigne +vanité dans des documents en français

(Première partie)

Russon Wooldridge

University of Toronto

Novembre 2001
© 2001 Russon Wooldridge

Introduction

L'objectif du présent exercice est de faire quelques analyses et réflexions à partir des résultats obtenus d'une interrogation typique du WWW faite au moyen d'un moteur de recherche. Soit l'interrogateur qui s'intéresse au concept de la vanité chez l'auteur Michel Eyquem de Montaigne.

1. La requête

La requête se limite à la cooccurrence dans un même document français des mots montaigne et vanité. Cette requête suffit aux besoins de l'exercice; le curieux pourrait, bien entendu, étendre son investigation à d'autres langues, aux mots vanitas ou vanity, par exemple; à d'autres auteurs influences de Montaigne ou influencés par lui, etc.

Syntaxe de la requête dans AltaVista:

2. Le moteur de recherche

2.1. Consommation

La nature de plus en plus commerciale du WWW atteint les moteurs de recherche, dont certains au moins privilégient, d'une façon ou d'une autre, des sites influents. Par exemple, Google privilégie les sites les plus visités ; ce qui pousse l'usager à visiter un site peut être, bien entendu, la valeur intrinsèque du site (valeur d'érudition pour le curieux intellectuel, par exemple), ou bien une valeur marchande accordée par la publicité (sur le WWW ou dans les médias traditionnels). Par ailleurs, en demandant à l'utilisateur de déclarer ses préferences, dont la langue des documents à retenir dans la recherche, au moyen de cookies, Google fait de lui un consommateur stéréotypé, même si ses pages de résultats ne font pas de publicité commerciale.

2.2. Curiosité

Si AltaVista met sur ses pages de résultats des publicités flagrantes et souvent absurdes du type "Find +montaigne +vanité at eBay! Register now!", il continue à afficher ses résultats dans un ordre essentiellement démocratique fondé sur l'importance des mots-clés dans le document quand ce n'est pas l'anarchie pure et simple. Le curieux est content des surprises que lui réserve ce genre d'aléatoire. Aussi nous sommes-nous servi d'AltaVista pour le présent exercice, qui se veut, dans la mesure du possible, représentatif des richesses du WWW.

2.3. Étape 2 (à faire l'objet d'une analyse ultérieure)

Dans un deuxième temps, nous comptons étendre la présente analyse pour comparer les résultats offerts par plusieurs moteurs de recherche (dont Google). Dans ce qui suit, il ne sera question que des résultats obtenus à l'aide d'AltaVista.

3. La date

Les résultats analysés ici ont été recueillis à partir d'une requête faite le 14 septembre 2001. La veille ou le lendemain, ils auraient été différents. L'important est qu'ils représentent une synchronie typique.

4. Les résultats

La requête a produit 188 résultats, nombre suffisamment grand pour pouvoir offrir une variété de types de documents et des contextes de nature variable, suffisamment petit pour être jugé pertinent et pour donner lieu à un dépouillement exhaustif rentable.

Le lecteur pourra lui-même exploiter le corpus des résultats pour faire d'autres analyses.

Nota: les documents suivants s'ouvrent dans une deuxième fenêtre pour faciliter la comparaison avec la présente page; le lecteur peut, s'il le préfère, ouvrir une fenêtre différente pour chaque document:

4.1. Mots fréquents et mots thématiques

Le dernier document signalé dans la section précédente permet de se faire une première idée schématique de la nature du corpus.
  • Il est normal dans tout texte français de trouver de, la, l', et, le, à, des, les, d', a, est, du, en, que, un, etc., parmi les mots les plus fréquents.
  • Les mots http, www, fr, html, com et htm sont des mots outils du langage du médium.
  • montaigne et vanité sont les mots-clés thématiques de l'enquête, donc très fréquents. On notera parmi d'autres mots thématiques relativement fréquents: essais (fréq. 50), pascal (47), philosophie (33), citations (32) ou rousseau (26).

    4.2. Résultats nuls ou partiels

    4.3. Cooccurrences

    4.4. La pertinence des cooccurrences

    Le degré de pertinence des rapports entre Montaigne et vanité varie dans les subdivisions c-e données ci-dessous.

    a) Pages-résultats consacrées à Montaigne:

  • nos 2a, 2b, 4a, 25b, 27, 28b, 30, 32b, 48, 57a-b, 59, 69, 77b, 80b, 89, 100, 118

    b) Le mot vanité ou le thème de la vanité chez Montaigne:

  • nos 1, 2a, 2b, 3, 4a, 5a-b, 10, 12, 14, 17b, 23, 25b, 27, 28b, 30, 32b, 33a, 33b, 34a, 40, 48, 50, 57a-b, 59, 61, 69, 77a, 77b, 78, 80b, 89, 94, 100, 112, 113, 118, 120, 137a, 139

    c) Montaigne associé à d'autres écrivains qui parlent de la vanité:

  • Pascal: nos 32a, 32b, 36, 71, 88
  • Rousseau: nos 5c, 11a, 62b, 64, 103, 110b, 142
  • Stendhal: nos 4b, 130a

    d) Montaigne et vanité partageant la ou une thématique générale de la page:

  • nos 9, 11b, 26, 35, 36, 42, 46, 56, 71, 76, 79, 80a, 84b, 90, 95, 99, 101, 103, 110a, 110b, 111, 122, 123, 130a, 133

    e) Sans rapport: le reste

    4.5. Sens de la visite: porte de devant, porte de derrière, porte d'entrée

    Passant maintenant du contenu spécifique de notre recherche à la forme des résultats, nous aimerions ajouter que le dépouillement des pages-résultats du corpus d'enquête nous a amené à faire quelques constatations concernant la navigation de chaque site.

    L'auteur d'un site en construit l'entrée à partir de ce que nous appellerons une porte de devant (front door); l'entrée de l'usager peut être celle prévue par l'auteur, mais peut être aussi – surtout lorsqu'il y arrive par l'intermédiaire d'une page de résultats fournis par un moteur de recherche – une porte de derrière (back door). Selon que le site est bien construit, mal construit ou peu construit, l'usager aura plus ou moins de facilité ou de difficulté à explorer le site. La présence ou l'absence de boutons de navigation en sera un facteur important.

    Il est, en principe, un autre moyen d'explorer un site. "En principe", puisque cette voie est de moins en moins praticable ou de moins en moins offerte sur le WWW. Il s'agit d'une page racine, traditionnellement index.html, du répertoire dans lequel se trouve l'usager. Soit une page de résultats http://www.site-montaigne.net/vanite/occurrences.html. Un site librement accessible contiendra une adresse http://www.site-montaigne.net/vanite/index.html que l'usager pourra retrouver en amputant occurrences.html de l'adresse http://www.site-montaigne.net/vanite/occurrences.html; soit http://www.site-montaigne.net/vanite/, qui équivaut à http://www.site-montaigne.net/vanite/index.html.

    Prenons, par exemple, la page de résultats n° 76 http://www-ellug.u-grenoble3.fr/ellug/livres/Nef.des.Folles/Introduction.html, intitulée "La Nef des Folles". Si on retranche de l'adresse Introduction.html, on a http://www-ellug.u-grenoble3.fr/ellug/livres/Nef.des.Folles/, qui correspond à une page intitulée "Stultiferae Naves. La Nef des Folles. Josse Bade, 1500". L'usager s'y retrouve tout de suite.

    La plupart des pages-résultats de notre enquête sur Montaigne + vanité ne permettent pas ce type d'accessibilité, que ce soit pour des raisons de manque de construction, ou pour des raisons de dirigisme. Un exemple de chaque cas de figure:

    Une page sans boutons de navigation ni fichier index.html associé (il y en plusieurs exemples dans le corpus d'enquête) risque ainsi d'être plus ou moins orpheline et de perdre de sa valeur si elle fait partie, dans sa conception, d'une entité plus grande.

    Les barrières du type "Accès interdit", "Directory Listing Denied", "Forbidden", "Liste du répertoire refusé", "Access Forbidden", "You don't have permission to access /X on this server", "Désolé, vous n'avez pas accès cette information" (on s'excuse au moins!) sont pour le moins frustrantes, surtout quand elles sont érigées en anglais (il n'est qu'à penser à la connotation traditionnelle du mot verboten).

    4.6. Une typologie des documents

  • Oeuvre littéraire – Montaigne: Nos 2a, 2b, 25b, 118
  • Oeuvre littéraire – autres: Nos 5c (Rousseau), 11a (Rousseau), 11b (Sand), 17a (Asselineau), 17b (Mouton), 35 (Robin), 38 (Gaigneu), 44a-44b (Balzac), 52 (Burton), 54 (La Fontaine), 62a (Pascal), 62b (Rousseau). 74 (Asselineau), 76 (Bade), 81 (Laurentie), 102 (Hellens), 103 (Rousseau), 115 (Stendhal), 125 (Bruneval), 138 (Arrabal), 140 (Barbey d'Aurevilly), 142 (Rousseau)
  • Critique littéraire: Nos 4a (Montaigne), 4b (Stendhal), 9 (Courier), 14 (Pascal), 30 (Montaigne), 48 (Montaigne), 53 (Rousseau), 57a-b (Montaigne), 59 (Montaigne), 60 (Rousseau), 64 (Rousseau), 69 (Montaigne), 71 (Pascal), 78 (Descartes), 79 (Montaigne), 80a (Sebond), 80b (Montaigne), 90 (Montaigne), 91 (Molière), 120 (Arvers), 123 (thèse sur concepts moraux et philosophiques), 124 (Bayle), 141 (Renaissance)
  • Discours, essai: Nos 13, 15, 19, 20, 21a, 21b, 22, 23, 25a, 28b, 29, 31, 41, 46, 49, 51, 55, 56, 58, 61, 63, 65, 70, 72, 75, 82, 83, 84a-b, 86, 87, 92, 95, 96a-b, 97, 104, 105, 107, 109, 114, 117, 122, 126, 127, 128, 129, 131, 133
  • Dictionnaire, langue: Nos 1, 39, 40, 43, 116
  • Cours: Nos 33a-33b, 77a-77b, 99, 110a-110b, 112, 113, 135, 139
  • Notice: Nos 32a (Encarta), 32b (Petit Robert), 36 (Enc), 50 (PR), 71 (Enc), 88 (Enc), 130a-130b
  • Bibliographie: Nos 10, 16, 24, 34a, 34b, 119, 136
  • Citations chères à Montaigne (peintes sur les travées de sa 'librairie'): Nos 4a, 100
  • Citations chères à d'autres: Nos 6a, 6b, 7, 8a, 8b, 18, 26, 28a, 37, 42, 47, 66, 68, 73, 85, 89, 93, 94, 101, 106, 111, 132, 134
  • Catalogue d'éditeur ou de libraire: Nos3, 27, 67a, 67b, 98, 108, 121, 137a-137b
  • Outil de lecture, démonstration de logiciel: Nos 5a, 5b, 45
  • Calendrier culturel: Nos 12

    Les rubriques de cette typologie approximative ont des frontières assez floues: oeuvre littéraire vs discours/essai vs critique littéraire; cours vs notice vs bibliographie vs catalogue; etc.

    La rubrique qui frappe peut-être le plus par sa fréquence est celle des Citations. Deux sites nous offrent les citations qui ont inspiré Montaigne, qui pouvait les regarder peintes sur les travées du plafond de sa bibliothèque. A sa suite, maint site personnel se plaît aujourd'hui à offrir au lecteur sur le World Wide Web les citations favorites de l'auteur du site; Montaigne y figure en bonne place, comme aussi le thème de la vanité. Dans d'autres rubriques, notamment la critique littéraire et les discours/essais, on trouve maint contexte dans lequel on invoque, textuellement ou par référence, l'autorité de Montaigne.

    Trois sites offre des oeuvres de Montaigne: sur le site n° 2, on trouve l'intégalité des trois livres des Essais en orthographe d'époque (le texte serait celui de l'édition de 1595, sans qu'on nous en dise davantage; la page de titre manque, comme aussi toute autre pièce liminaire); le n° 118 contient l'intégralité du premier livre des Essais en orthographe moderne (aucune identification de l'édition utilisée); le site n° 25b reproduit en orthographe moderne (aucune indication de l'édition citée) une partie du chapitre 9 "Sur la vanité" du premier livre.

    L'érudition, professionnelle ou amateur, domine, sur des sites institutionnels ou personnels. La part du commercial est relativement celle du pauvre.

    4.7. Éléments d'un portrait de Montaigne et la vanité dans le WWW

  • On peut commencer par le vers de l'Ecclésiaste reproduit en partie sur une des travées de la bibliothèque de Montaigne (cf. sites nos 4a, 100): "vanitas vanitatum dixit Ecclesiastes vanitas vanitatum omnia vanitas" (1.2).
  • Ce serait une influence majeure du chapitre 9 du livre III des Essais, comme du traitement de la vanité chez Pascal, influencé lui-même par Montaigne (plusieurs sites en parlent). (Une recherche plus large y ajouterait S. Augustin et l'Imitatio Christi du XVe siècle.)
  • On peut tracer une filiation Ecclésiaste-Montaigne-Pascal-Rousseau-Stendhal (cf. 4.4 supra).
  • Montaigne et la vanité sont évoqués par nombre d'auteurs et d'orateurs de toutes sortes à partir de Pascal, jusqu'aux créateurs contemporains de receuils de citations en ligne (sites passim).

    Conclusion

    Sans aller plus loin, on peut dire que celui qui s'intéresse au concept de la vanité chez Montaigne trouvera sur le WWW une bonne documentation de départ, qui, selon son degré de curiosité, soit lui offre déjà une matière suffisante, soit lui indique clairement plusieurs pistes pour une recherche en bibliothèque plus approfondie.