Cette communication présente quelques modèles d'investigation et d'analyse, ainsi que quelques mesures des phénomènes étudiés.
Adresse Web (URL) : "http://www.esprit-equipe.com/" ; dont une des balises méta est "<META NAME="Description" CONTENT="L'Esprit d'Equipe est une agence de marketing sportif organisée autour de 4 métiers complémentaires : les Relations publiques, le Sponsoring, l'Evénementiel et la Promotion de marques.">"
Google, pages francophones (5 avril 2003), sites .ca : gratuiciel(s) x 1 504
Google, pages francophones (5 avril 2003), sites .fr : gratuiciel(s) x 1 589
Google, pages francophones (5 avril 2003), sites .ca : gratuitiel(s) x 1 009
Google, pages francophones (5 avril 2003), sites .fr : gratuitiel(s) x 112
Google, pages francophones (5 avril 2003), sites .ca : freeware x 760
Google, pages francophones (5 avril 2003), sites .fr : freeware x 41 800
"Anglais electronic mail message Synonyme(s): e-mail message, electronic message, e-mail, e-message [...] Français courriel n. m. [...] Synonyme(s): message électronique n. m., courrier électronique n. m." (Ibid.)
Google, pages francophones (5 avril 2003), requête +"e-mail" -email site:.fr : e-mail x 1 000 000
Google, pages francophones (5 avril 2003), requête +"e-mail" -email site:.ca : e-mail x 81 000
Google, pages francophones (5 avril 2003), requête +email -"e-mail" site:.fr : email x 624 000
Google, pages francophones (5 avril 2003), requête +email -"e-mail" site:.ca : email x 54 400
Google, pages francophones (5 avril 2003), requête +mél -mel site:.fr : mél x 103 000
Google, pages francophones (5 avril 2003), requête +mél -mel site:.ca : mél x 811
Google, pages francophones (5 avril 2003), requête +mèl -mel site:.fr : mèl x 6 870
Google, pages francophones (5 avril 2003), requête +mèl -mel site:.ca : mèl x 29
Google, pages francophones (5 avril 2003), sites .ca : pourriel x 341, pourriels x 251
Google, pages francophones (5 avril 2003), sites .fr : pourriel x 123, pourriels x 69
Google, pages francophones (5 avril 2003), sites .ca : spam x 3 990
Google, pages francophones (5 avril 2003), sites .fr : spam x 18 500
Le Petit Robert est explicite au sujet du pluriel de travail et de national :
"NATIONAL, ALE, AUX"
"Règle générale. La plupart des noms et adjectifs en -al ont un pluriel en -aux. Les offices nationaux. Des cerises en bocaux. [...] Quelques noms et adjectifs ont un pluriel en -als. aval, bal, banal, bancal, cal, carnaval, cérémonial, choral, étal, fatal, festival, natal, naval, pal, récital, régal, tonal, val, virginal. [...] Dans plusieurs cas, l’usage est hésitant et on trouve les deux pluriels. austral, boréal, causal, final, glacial, idéal, marial, pascal." (Softissimo. La grammaire interactive)
Dans les observations suivantes des usages du Web, nous préférerons souvent interroger des syntagmes plutôt que des mots isolés potentiellement ambigus (interférence de l'anglais, etc.). Recherches dans les pages francophones de Google (23-25 avril 2003).
Google : résultats finals x 1 250 ; résultats finaux x 4 360
Google : rapports finals x 1 120 ; rapports finaux x 1 800
Google : examens finals x 719 ; examens finaux x 1 960
Google : chantiers navals x 19 400 ; chantiers navaux x 57
Google : combats navals x 685 ; combats navaux x 10
Google : prénatals x 3 980 ; prénataux x 2 950
Google : postnatals x 1 500 ; postnataux x 685
Il est d'usage de parler d'exercices structuraux, ce qui n'empêche pas de rencontrer également exercices structurels :
"Quatre sortes d'exercices sont ainsi identifiées : les exercices de repérage, les exercices à trous, les exercices structurels et les exercices de transformation." ("Discours de consigne", Télé 3, Sorbonne Nouvelle)
"Exercices grammaticaux - Exercices structurels" (Enseignement à distance, Université de Caen)
"Fribourg: Vitrails de Mehoffer à la cathédrale" (page des "sites officiels de l'Etat et de la Ville de Fribourg")
Google : travails x 4 190 ; travaux x 1 570 000, dont pour la première forme travails scolaires x 2
le ver / verre / vers / vert est dans le fruit
Le jeu de mots homophonique potentiel dans sous les meilleurs hospices (contexte = Beaune), mais noyé dans la masse des fautes réelles est plus facile à observer dans le X est dans le fruit.
La très grande majorité des occurrences de le vers est dans le fruit reviendraient à des confusions réelles (à noter que le pluriel de ver est vers) un ou deux jeux de mots : "'Le vers est dans le fruit': lecture de poèmes". Dans les trois exemples de le verre est dans le fruit, il s'agit de boissons, donc de jeu de mots. De même, les occurrences de le vert est dans le fruit relèvent de contextes dont le thème est soit l'écologie, soit la couleur.
nu(e)(s) comme un ver / verre / vers / vert.
On observe les mêmes tendances que dans le ver est dans le fruit, avec, en plus, l'intervention d'un facteur de distortion statistique important : l'appartenance du mot nu au champ sémantique de la pornographie, ce qui a pour résultat d'augmenter le nombre d'occurrences.
Il y a encore un autre facteur de confusion qui influence la graphie de ver : la cooccurrence avec terre dans le mot-syntagme ver de terre. Google, pages francophones, trouve (8 avril 2003) 281 occurrences de verre de terre, dont confusions réelles et jeux de mots et dont trois occurrences de "nu comme un verre de terre".
Deux complications de la recherche : 1) Google n'accepte pas le joker de fin de mot, alors que le moins performant AltaVista le reconnaît ; 2) le troisième mot de l'expression peut s'écrire de deux façons : voeu ou vœu.
Confusion plus surprenante peut-être que la précédente mais réelle et aussi plus fréquente :
a) soit éminent collègue vs. imminent collègue
"Je voudrais essayer d'éclaircir, une fois pour toutes, la fameuse question que le premier ministre nous rabâche en réponse depuis qu'on lui pose des questions et que l'imminent collègue vient de poser à ma collègue de Laval-Centre." (Hansard des débats de la Chambre des Communes, Gouvernement fédéral, Ottawa : Initiatives ministérielles, 16 mai 1996)
"A quoi servent les gestes?
A arracher, à séduire,
A enfirouaper, à conquérir;
Après, qu'est-ce qu'il reste?"
"Je suis la dernière arrivée. Denyse est sûrement une philanthrope ou plutôt une "félinthrope", une sensible qui se laisse enfirouaper. Autrement, elle m'aurait amené à la SPCA." (Extrait de Denyse Mageau vue par ses trois chats)
"Mais, comme toujours, les francophones au Québec n'ont été surpassés que par leurs congénères d'Ottawa, politiciens et fonctionnaires. Et le Canada anglais s'est fait joliment « enfirouaper »." (Expression d'opinion politique)
"M. Gautrin: M. le Président, si vous le permettez, j'ai présenté une motion sans préavis. Le gouvernement dit oui ou non. Maintenant, qu'ils essaient d'enfirouâper ça pour toutes les raisons pour lesquelles ils disent non, moi, je n'en sais rien." (Débat de l'Assemblée nationale)
"Pas plus que la veille quand il s'était rué sur Eddie Irvine, pour lui dire son fait, un Villeneuve frondeur ne s'est laissé intimider, dans un affrontement décisif, avec l'Allemand qu'on disait tellement fort qu'il allait l'enfirouaper. Une saison de fou pour Jacques qui a démontré qu'il avait toute une carapace." (Le Soleil, journal)
Le moteur de recherche AltaVista, à la différence de Google, permet de découvrir des formes lexicales au moyen du joker de fin de mot. La requête enfirou* nous a permis de découvrir les dérivés enfirouapage et enfirouapeux :
"Le ministre de l'enfirouâpage systématique étale son intransigeance crasse. Aujourd'hui, il fait dire aux juges de la Cour suprême ce qu'ils n'ont jamais dit." (Site Vigile «Je me souviens»)
"Mais voilà, les politiciens enfirouapeux et malhonnêtes font [sic] légions [sic]." (Page de Luc Richard)
-ciel, -ware, cyber-, surf-
Bon nombre des éléments de composition des termes d'Internet sont très productifs. Nous avons examiné la productivité de -ciel, -ware, cyber- et surf- dans le Web dans une étude de 1998 (R. Wooldridge, "Expressing the Cybermedium in English and French").
Les noms varient encore plus, étant souvent choisis en fonction de la thématique du contexte : par exemple, bulle en parlant d'injonction papale ("les Américains se moquent, comme de leur première bulle, de cette injonction papale"), perruque en parlant de Vivaldi ("Vivaldi, évidemment, s'en fiche comme de sa première perruque"), ou moustache en parlant de Georges Brassens ("dont Brassens se foutait comme de sa première moustache"). On notera quand même que le nom "normé" (attendu) chemise s'emploie 18 fois ; chaussette se retrouve quatre fois. Parmi les autres premiers objets plus ou moins "normaux" : paire de culotte (ou culotte tout court, culotte courte, couche-culotte, voire Sainte Culotte), paire de bobettes, sucette, socquette, robe, slip, caleçon, anorak, cotillon, biberon, cure-dents, kleenex, cheveu, baiser.
Voir aussi changer de X comme de chemise : en plus du connu changer d'avis comme de chemise, on trouve des occurrences multiples de changer de nom / idée / maillot / religion / prof comme de chemise.
Les mesures faites ici varient entre l'exact et le flou, mais elles ont toujours une valeur relative certaine.
Certains des exemples choisis illustrent l'intérêt socio-linguistique de l'exploration du Web comme corpus d'usages linguistiques : comparaisons géo-linguistiques (cf. courriel vs. email, etc. dans la section 1.2) ; esprit de corps vs. esprit d'équipe (1.1.2) ; distortions quantitatives provoquées par les sites pornographiques (1.4.1, 2.2.2 on sait que le mot-clé le plus utilisé dans les requêtes par moteur de recherche est sex/sexe).
Dans plusieurs cas, nous avons confronté l'usage observable dans le Web avec les déclarations normatives du dictionnaire. Dans certains cas, les occurrences en ligne viennent enrichir et compléter ce qu'offre le dictionnaire (ex. enfirouaper, 2.1.1) ; dans d'autres cas, l'usage réel entre en contradiction avec le dictionnaire, qui n'enregistre que ce qu'il juge sanctionné par la norme. C'est le cas, par exemple, de l'adjectif chou que le dictionnaire (Petit Robert et TLFI) déclare être invariable, mais que les occurrences du Web montrent clairement variable, donnant au pluriel chou, chous ou choux (1.3.4).
Pour une zone qui se situerait entre le très fréquent (plusieurs centaines de milliers de résultats) et le très particulier (idiolectes) et dont les unités sont observables du point de vue de leur forme (syntagmatique vs. polysémie), le Web peut offrir des instantanés mesurables de plusieurs types de phénomènes linguistiques, quitte à raffiner les résultats par des analyses de détail. C'est le seul corpus étendu qui ne demande pas une construction coûteuse en termes de temps et d'argent. Corpus peu théorisé donc et non la chasse gardée de spécialistes ou d'équipes de chercheurs en quête de subventions importantes. Corpus virtuel qui est transformé en corpus concret par l'usager se servant intelligemment de moteurs de recherche. Pour la première fois, quiconque s'intéresse à l'usage réel de la langue a à sa disposition un champ d'observation de valeur scientifique autrement plus satisfaisant et complet que les analyses ponctuelles et les recueils de perles des auteurs de livres ou de chroniques.
L'avenir du Web-corpus est prometteur. En perpétuelle expansion (par ex. navigateur(s) = 9 793 occurrences en décembre 1997, 804 000 en mars 2003 cf. R. Wooldridge, "L'expression d'Internet en anglais et français (2): cinq ans après"), il offre un terrain d'exploration toujours plus riche à l'observateur de la langue, que celui-ci se contente d'instantanés approximatifs ou s'attarde à développer des agrandissements à définition variable.