3. Homographie et lemmatisation

3.0. Généralités

La séparation des homographes n'a été faite que dans un nombre de cas très limité et pour des raisons purement pratiques (v. 4.1); aucune lemmatisation n'a été superposée au texte. Ceci dans un souci de respecter à la fois le texte et l'usager de la concordance, aussi bien que par un constat de l'impossibilité linguistique et matérielle de la tâche. Les impératives menant à cette option sont, par ordre d'importance croissant: les dimensions du corpus (900.000 mots de texte); la nature instable de la langue du seizième siècle à cheval sur le moyen français et le français moderne; la nature hétéroclite du texte. Le Thresor est diachronique par sa genèse (somme des quatre éditions, 1539-1573, du Dictionaire françois-latin et de l'apport de Nicot, 1573-1606) et par son intention («Thresor de la langue françoyse, tant ancienne que moderne»); il est monolingue, bilingue (français-latin) et multilingue (une quarantaine de langues et de dialectes y sont représentés), et souvent interlinguistique (on ne sait pas, par exemple, si m. vient de masculin ou de masculinus); il est souvent difficile d'établir l'appartenance linguistique en discours d'un mot ou d'une expression de provenance manifestement non française utilisé dans un énoncé français -- d'autant plus que Nicot passe facilement, à l' intérieur d'un méme énoncé, du français au latin, voire au grec. De même, le mot autonyme (unité de traitement, représentation graphique ou phonétique, étymon) pose maintes fois des problèmes d'identification, non seulement du point de vue de la langue d'appartenance, mais aussi concernant la possibilité de l'attribution d'une étiquette catégorielle unique à chaque occurrence; l'absurdité de cette dernière entreprise est bien illustrée: pour tasche, par le contexte suivant: «Tasche [...] Est ores la premiere et tierce personne du verbe dont l'infinitif est Tascher [...] Et ores nom f. gen.»; pour don, par «Don [...] Tantost [...] vient de ce mot Latin Dominus [...] Tantost [...] vient de Donum Latin»; pour pis, par «Pis, tantost est nom, et signifie ores le tetin [...] Ores le nombril [...] Tantost est adverbe», etc. C'est que le Thresor est un mélange de texte lemmatisé (mots mentionnés) et de texte non lemmatisé (mots utilisés), de langue et de discours, de langue et de métalangue; les énoncés du texte, agencés en parallèle autant qu'en série, subissent l'économie du discours lexicographique elliptique.

La discussion qui suit a pour but d'offrir à l'usager de la concordance quelques lignes directrices pour la séparation des homographes et le regroupement des formes fléchies et des variantes. L'homographie de la concordance et celle du Thresor divergent sur trois points: la modernisation, dans la concordance, de i/j et de u/v réduit le nombre d'homographes -- «iure» devient ivre ou jure, selon le cas; quelques homographes de haute/basse fréquence (par ex. s' = se/si) ont été différenciés (v. 4.1); en revanche, la neutralisation, dans la nomenclature de la concordance, de la majuscule et de la minuscule en crée de nouveaux -- pierre et Pierre sont confondus s.v. pierre.

3.1. homographes

Nous passons rapidement sur les homographes communs au seizième siècle et au français contemporain: livre, mort, somme, ton, ce, le, dure, fin, virent, suis, etc. Notons que l'addition ultérieure des accents peut faire subsister l'homographie: celebre, present, tasche (Nicot); célèbre, présent, tâche (français moderne). Parmi les homographes créés par la perte de la majuscule dans la nomenclature de la concordance, mentionnons: tours/Tours, vienne/Vienne, inde/Inde.

Pour ce qui est de l'homographie caractéristique de l'époque du Thresor, l'on peut noter des divergences catégorielles par rapport au français moderne. Nous donnons quelques exemples de chaque catégorie.

a) Orthographe:

soye (nom et verbe), soy (pronom et verbe), aux (nom et prép.), sale (nom, adj. et verbe), croit (de croire et croistre), du (prép. et debvoir), marchant (nom et part.), sur (adj. et prép.), cacher (mod. cacher et chasser), dens (nom pl. et latin), coupe (verbe, nom et mod. coup), par (nom, prép. et latin), estimez (present et part.).

b) Fonctions grammaticales: cestuy, cette, ceste, iceluy, celle (tous pronoms et adjs); baisser, craquer, dormir, marcher, mourir, partir, passer, rendre, tourner, vivre (verbes et noms -- ce mode de dérivation est très productif).

c) Mots, sens, emplois qui ne subsistent pas ou guère en français moderne: navire (mod. "navire" au masc., "flotte" au fém. -- quoique le mot féminin s'emploie aussi au premier sens; dans la catégorie des noms à genre variable, on peut citer également auge, affaire, arbre, office, offre); tournois (nom pl. et adj.); serve (nom, adj. et verbe); ars (mod. ars, pl. de art, présent et part. de ardre, latin); mon (adj. et adv.); passager (nom, adj. et verbe).

Puisque le texte est un dictionnaire, il contient aussi bien des éléments de composition (affixes, racines et syllabes) et des lettres que des mots autonomes. L'unité de concordance c recouvre la lettre c (en plusieurs langues), le chiffre romain et l'abréviation de plusieurs mots, dont c'est à dire, Cicero (en fait Cicerone) et caput (capito). Presque toutes les unités de concordance ne comportant qu'une lettre sont des homographes. Parmi les éléments de composition, mentionnons able (homographe de able nom), des (également art. et prép.-art.), ens (adv.), tres (adv. et latin), bar (également nom propre).

3.2. formes fléchies

Notre intention ici n'est pas de refaire les tableaux de flexion du français du seizième siècle, mais plutôt de rappeler quelques-unes des principales flexions caractéristiques de la langue de l'époque et qui ont été modifiées par la suite. La clef des flexions, des suffixes et des fins de mot en général est ici la liste alphabétique inverse (cf. 4.4).

a) Le pluriel (nom, adjectif, participe):
-nt -> -ns enfans, dens, gens, medicamens, cens, estans, allans,
tenans
(on trouve aussi la forme en -nts)
-nd -> -ns grans (on trouve aussi grands)
-> -ez alliez, amitiez, voluptez, qualitez, appelez, estimez, baillez
-i -> -iz puniz, partiz (la forme en -is est plus fréquente)
-u -> -uz revenuz (la forme en -us est plus fréquente)
-rt/-rd -> -rs ars, brancars, pars, rempars (on trouve aussi les
formes en -rts, -rds)
b) Le féminin:
-f -> -fve briefve, brefve, vefve (le
féminin sans f est rare)
c) L'imparfait et le conditionnel:
formes en -oy(e)(nt) pensay, scavoy, voudroy, oseroy,
vouldroye, scauroye,faisayent, disoyent,
pourroyent
formes en -ois, -oit, -oient avois, estois, donnerois, dirois,
demandoit, souloit, seroit, faisoient,
usoient
d) Le futur:
formes en -ay feray, seray, diray
e) Le présent, l'impératif:
-ndre -> -n(s) pren, enten, attens

3.3. variantes

Le vaste domaine des variantes demande une étude à part. Ne seront indiqués ici que des cas généraux au niveau du système. Les immenses dimensions, dans le Thresor, du phénomène de la variante proviennent principalement, d'une part du projet encyclopédique de Nicot de faire l'étymologie comparative des mots et d'accumuler, souvent pour les critiquer, les différentes graphies et prononciations réelles et virtuelles du mot, et d'autre part de la présence dans le dictionnaire de formes héritées d'Estienne à côté de celles introduites postérieurement. Il en résulte parfois des inconséquences: soldat(s), critiqué s.v. Soudard et préconisé s.v. Souldart, a, en fait, une fréquence d'emploi dans le texte supérieure à celle des formes en sou-. Dans le cas de soub, soubs, soubz, sous et souz, tandis que la nomenclature (s.v. Soubs) donne soubs (fréq. 3), soub (1) et soubz (6), les fréquences pour l'ensemble du dictionnaire sont dans un rapport tout autre: soub (1), soubs (48), soubz (6), sous (207), souz (5). Les formes hypothétiques, introduites par le mot quasi, sont souvent avancées pour expliquer l'origine du vocable: «Moucher, quasi Munger», «Leçon, quasi Lection». Les remarques de Nicot concernant la forme (graphie ou prononciation) des mots peuvent être consultées par l'intermédiaire de la concordance sous un certain nombre de mots-clefs énumérés à 5.1.

Le tableau formel suivant indique les alternances de lettres les plus fréquentes et donne quelques exemples de chaque type («C» = «consonne», «V» = «voyelle»).
a/e baffroy/beffroy, barlong/berlong, chaines/cheines
a/ai agu/aigu, gouvernal/gouvernail, fantasie/fantaisie
ai/e faistiere/festiere, enfaistau/enfestau
a/o damage/dommage
au/o aureille/oreille, cause/cose
c/ç ca/ça, facon/façon
c/cc acoucher/accoucher, sucre/succre
c/ch cacher/chasser, cronique/chronique, cercher/chercher
c/q cocu/coqu, vaincueur/vainqueur
c/qu piccons/picquons, brancars/branquars
cq/q doncques/donques
ch/qu bechet/bequet, cauchemar/cauquemare
c/s bocquet/basquet, forcené/forsené
ç/s garçon/garson, jaçoit/jasoit
c/ss chacer/chasser, bracelet/brasselet
ç/ss hameçon/hamesson
c/t prononciation/pronontiation, avaricieuse/avaritieuse
ct/t huict/huit, faict/fait
d/dd adresse/addresse, adition/addition
d/t quand/quant, allemand/allemant
e/é reel/réel, bled/blé, aucunement/aucunément, fée/feé
e/ée communement/communéement
ez/és prenez/prenés, appelez/appelés
e/ë boesseau/boësseau, eaue/eauë/eau
e/ei seze/seize, secher/seicher
e/es detail/destail, deboisté/desboisté
e/i desjoindre/disjoindre, definir/diffinir
er/ier berger/bergier
er/ir aviler/avilir, finer/finir
e/o demaine/domaine, behourd/bohourd
eo/o veoir/voir, asseoir/assoir
e/u beffroy/buffroy
eu/u heurter/hurter, cheveleure/chevelure
el/eau damoisel/damoiseau, bel/beau
es/ac escouter/accouter
f/ff defense/deffense, dyfamer/diffamer
f/ph blafarde/blapharde, profane/prophane
g/c cigoigne/cicoigne
g/gg agreable/aggreable
hV/V haleine/aleine, hubir/ubir
ifs/is apprentifs/apprentis, archifs/archis
i/u rim/rum
l/ll alegresse/allegresse, royale/royalle, appeler/appeller
l/lle albrent/allebrent, alman/allemand
ln/n aulnaye/aunaye
lt/t oultils/outils
l/r boulingue/bouringue
m/mm damage/dommage, comin/commin
m/n comte/conte, compte/conte, condamné/condanné
n/gn auvernas/auvergnas
gn/ngn bourgoigne/bourgongne, besogne/besongne
n/ng un/ung
n/nn honeste/honneste, narbone/narbonne
o/os bocal/boscal, boquet/bosquet
o/ou borras/bourras
ou/on couvents/convents
ois/oye anchois/anchoye
o/u automne/autumne, consolat/consulat
o/ue court/cueurt
ou/u assoubjectir/assujectir
p/pp aprecir/apprecier, oportun/opportun, apellent/appellent
pt/t dompter/domter, banqueroupte/banqueroute
r/rr araisonner/arraisonner
s/ss deservir/desservir, vaiselle/vaisselle, resembler/ressembler
s/t dissension/dissentions
s/x esclamez/exclamer, adestre/adextre
s/z disaine/dizaine, horison/horizon, deces/decez
sC/C quelquesfois/quelquefois, bisches/biches, despuis/depuis
sou/soub soudain/soubdain
sou/sous soupçon/souspeçon
t/th apoticaires/apothicaires, auteur/autheur, tolose/tholose
t/tt debatre/debattre, dites/dittes, fuite/fuitte
v/bv fievre/fiebvre
v/dv aventure/adventure, avantage/advantage
v/fv neuve/neufve
y/i amy/ami, cy/ci, moyen/moien

[Retour à la table] -- [Suite]