L'anglais moderne est un amalgame de l'anglo-saxon, issu des invasions de tribus germaniques entre le IVe et le VIe siècles, et du français apporté au XIe siècle par les Normands à la suite de la Conquête cf. les cows, sheep et pigs élevés par les serfs anglo-saxons et le boeuf (angl. beef), mouton (angl. mutton) et porc (angl. pork) mangés par seigneurs normands. Voilà des éléments de linguistique historique, ou diachronique ; celle-ci s'oppose à la linguistique synchronique, qui va nous intéresser plus particulèrement dans ce cours sur le français moderne. Diachronie et synchronie sont, comme beacoup de termes scientifiques, des mots grecs : dia- "à travers" (comme dans diagonal, dialogue, diaspora) + chronie "temps" ; syn- "avec (dans le temps ou l'espace)" (comme dans synchronicité, synergie, synonymie, synthèse). Sur l'axe diachronique on peut étudier l'évolution de la langue ; sur l'axe synchronique on étudie un état de langue ; on peut comparer deux synchronies, par exemple le "français de Molière" et le français d'aujourd'hui pour observer les différences entre un état et un autre. Le français d'aujourd'hui est parlé par des enfants, des jeunes, des adultes et des vieux, chaque groupe employant, dans des proportions variables, des termes soit nouveaux, soit établis, soit archaïsants (sans parler de différences géographiques ou sociolinguistiques) on parlera d'une synchronie épaisse, d'environ soixante ou soixante-dix ans (la synchronie absolue n'existe que comme notion abstraite).
La linguistique se veut objective, c'est-à-dire descriptive, et non subjective et prescriptive, comme c'est le cas de certains grammaires et dictionnaires. La linguistique tient compte de la norme et de l'usage ou des usages. La norme est liée au pouvoir, exercé autrefois par le roi (cf. "le roué c'est moué", L&B, p. 3) et aujourd'hui par les grands médias (dont la radio, la télévision, la presse écrite, les dictionnaires). L'usage, ou les usages, étai(en)t celui ou celle de ce qu'on appelait autrefois le peuple et aujourd'hui "le Français moyen" (ou "le Québécois moyen", etc.). Le sujet parlant (c'est-à-dire l'individu parlant ou écrivant sa langue) est plus conscient de la norme (par exemple, le français standard) quand il écrit (acte réfléchi) que quand il parle (acte spontané). Il emploie différents registres selon qu'il écrit ou qu'il parle, qu'il s'adresse à un inconnu ou à un ami ou proche ; pour illustrer cette distinction dans le contexte présent, un étudiant a tendance à s'exprimer différemment selon qu'il s'adresse à un camarade de classe ou au professeur. Il y a trois registres principaux : le registre familier d'une conversation avec un ami ou membre de la famille ou dans un message écrit adressé à un ami ou membre d'un même groupe d'âge ou d'intérêt ; le registre neutre ou ordinaire employé dans la conversation ou par écrit, qui ne montre ni familiarité, ni soin particulier ; le registre formel ou soutenu ou soigné, qui cherche à produire un effet de respect de l'autre. Cf. les exemples donnés par L&B (p. 4) : Ça va? (au lieu du neutre cela) = registre familier ; Comment allez-vous? = français neutre ; Je suis ravi de faire votre connaissance = registre soutenu.
Là où en anglais on dit simplement language d'une part pour le code employé par ce qu'on appelle une communauté linguistique (les francophones, les anglophones, les hispanophones, les lusophones, les italophones, les germanophones, etc.) et aussi pour la faculté de s'exprimer avec une langue orale ou écrite, le français distingue entre langue et langage. Comme le disent L&B (p. 5), "le terme langage désigne une faculté mentale qui permet à chaque être humain d'acquérir de façon « naturelle » [...] un système unique de communication que l'on appelle la langue." On note le mot système, que l'on appelle aussi un code. On a ainsi la langue française, la langue anglaise, la langue espagnole, la langue portugaise, l'italien, l'allemand, etc. La langue sert essentiellement à symboliser le réel (le mot éléphant remplace commodément la nécessité de montrer un éléphant à son interlocuteur) et à transmettre des messages. On notera en passant qu'on appelle la personne qui parle (ou qui écrit) le locuteur et la personne qui écoute (ou qui lit) l'interlocuteur (on dit aussi scripteur et lecteur dans le cas de la communication écrite).
On distingue entre la langue pour le système linguistique virtuel, décrit dans les dictionnaires et les grammaires et possédé par le sujet parlant sous forme de compétence linguistique, et la parole pour l'usage réel qui en est fait, c'est-à-dire pour toute performance linguistique, toute manifestation sous forme de message ou texte (au sens large) oral ou écrit dans une situation concrète. On notera qu'en linguistique, le terme parole s'applique également à la langue orale et à la langue écrite. On dit aussi discours à la place de parole. Ainsi les pièces de Molière ou votre conversation avec Michelle ou Robert sont des actes de parole. Nous avons utilisé le terme code tout à l'heure comme synonyme de système. Pourtant ce mot s'emploie surtout pour distinguer le code oral (la langue parlée) et le code écrit (pour la langue écrite). La phonétique et la phonologie (que nous étudierons ultérieurement) s'intéressent au code oral, alors que la morphologie, la lexicologie, la syntaxe et la sémantique (qui constituent d'autres domaines étudiés dans le cours) s'appliquent également au code écrit et au code oral. L'orthographe, qui est un domaine de la grammaire, ne concerne que le code écrit. On notera qu'en grec phônein veut dire "parler" et graphein signifie "écrire".
Poursuivons avec le mot code. Un code linguistique (tout comme d'autres types de codes, comme le code de la route) permet la communication humaine au moyen de signaux, lesquels sont arbitraires. La comparaison des langues permet de voir tout de suite l'arbitraire de la langue : pourquoi pour désigner un chien, dit-on dog en anglais, chien en français ou Hund en allemand?
La notion de communication désigne la transmission d'informations entre un émetteur et un récepteur (ou entre un locuteur et un interlocuteur). La communication suppose trois étapes : la production, la transmission et la réception. La production implique l'encodage des informations (en utilisant les règles du code linguistique choisi), alors que la réception implique le décodage. Certaines transmissions d'informations, ou messages, sont univoques, c'est-à-dire ils vont dans un sens uniquement, comme les bulletins de la radio ou l'article de journal. D'autres sont biunivoques ; ils vont dans les deux sens, quand le récepteur ou interlocuteur montre par des gestes ou par des paroles qu'il est d'accord, qu'il ne comprend pas, qu'il veut un supplément d'informations, etc. C'est le cas, par exemple, de la conversation orale ou du texto (texting) d'Internet. L&B (p. 14) note différents types de communication employant différents sens (l'ouïe, la vue, le toucher, l'odorat).
Le schéma de communication le plus célèbre parmi les linguistes est celui de Roman Jakobson (1963) qui propose le schéma suivant :
CONTEXTE | ||||
DESTINATEUR | -->-- | MESSAGE | -->-- | DESTINATAIRE |
CONTACT | ||||
CODE |
Par contexte, on entend le rapport entre le message linguistique et le référent de la situation extra-linguistique (il pleut est un message linguistique qui se réfère à la pluie que l'on peut observer dans la situation de communication). Le destinateur destine un message (c'est l'émetteur ou le locuteur) à un destinataire (ou récepteur ou interlocuteur). Le contact est nécessaire à la communication et s'effectue oralement par des expressions comme Eh, Michelle! ou Allo (au téléphone). A chacune des catégories du schéma, Jakobson attribue une fonction ; ces fonctions étant très critiquées (cf. L&B, p. 15), on ne s'y arrêtera pas ici.
Revenons encore au code. On distingue entre les indices involontaires, comme la fièvre (signe d'un état physique anormal) ou la force ou la hauteur de la voix (voix féminine vs. voix masculine, voix d'enfant vs. voix d'adulte), et les signaux volontaires, comme les panneaux que l'on voit au bord de la route. L'ensemble des signaux constitue un code, comme le code de la route. Dans le cas d'un code ou système linguistique, on parle plutôt de signes. Un même signe peut avoir différents sens selon le code dans lequel il est employé. Par exemple le signe X (cf. L&B, p. 16) : au Royaume-Uni il signifie "non" par opposition au tick qui a le sens de "oui", alors qu'en Amérique du Nord on coche les cases ("oui") avec une croix ; grand ou en italique c'est l'inconnu en mathématiques, alors que petit il correspond à la fonction "multiplié par" ; sur une carte ancienne, X peut avoir le sens "il y a trésor enterré ici" ; dans les chiffres romains, il signifie "dix" ; etc.
Venons-en à un concept clé de la linguistique et aux origines de la linguistique moderne. Ferdinand de Saussure, dans son Cours de linguistique générale (publié par ses élèves en 1915), parle du signe linguistique, qui a deux composantes interdépendantes : le signifiant, qui est l'image ou forme linguistique sonore ou écrite, et le signifié, qui correspond au concept exprimé par le signe (pour ce dernier on parle souvent du sens ou du contenu sémantique). Le signifiant est concret (sons ou caractères écrits), alors que le signifié est abstrait. Saussure illustre l'interdépendance nécessaire du signifiant et du signifié par la métaphore de la feuille de papier, dont chaque côté ne peut exister sans l'autre. Au référent 'chat' correspond un signe linguistique, dont le signifiant français est chat ou [] et le signifié est "petit félin familier...". Comme nous l'avons déjà vu, le signe est arbitraire (chien/dog/Hund), sauf, dans une certaine mesure, dans le domaine restreint des onomatopées, mais on retrouve l'arbitraire des onomatopées lorsqu'on compare plusieurs langues : le chien français dirait ouah, ouah, alors que son homologue anglais est censé dire woof, woof. Mais l'arbitraire est strictement réglementé par des conventions senties comme nécessaires pour maintenir l'efficacité du système linguistique et assurer la communication.
Dans la partie du cours consacrée à la phonologie, nous verrons que le signifiant peut être découpé en unités distinctives, qui dans le cas du code oral sont des phonèmes, ou unités de son, et dans celui du code écrit sont des graphèmes, ou unités graphiques ou écrites. Ainsi, [] contient deux phonèmes, [] et [] ; chat est composé de quatre graphèmes, ou lettres, c-h-a-t. Les signes linguistiques sont aussi discrets, c'est-à-dire qu'il n'y a aucune continuité possible. En entendant "Voulez-vous une Cière?" (où C représente une consonne mal entendue), on ne peut comprendre en français moderne courant que bière ou pierre ; la question était soit "Voulez-vous une bière?", soit "Voulez-vous une pierre?".