Actes des Journées "Dictionnaires électroniques des XVIe-XVIIe s.",
Clermont-Ferrand, 14-15 juin 1996
N. Catach, "Pour un meilleur traitement des textes et graphies anciennes sur ordinateur"

6. Les variantes

Rappelons brièvement qu'au XVIe s., le "mot" graphique ne relève pas d'un usage standard, ni même de l'expression d'une "variante majoritaire", mais d'un choix ouvert, qui dépend de la formation de l'auteur, de son milieu, de sa région, du style ou genre pratiqués, des ateliers qui le prennent à charge, etc.

L'orthographe d'un texte sera donc la résultante: de la copie de l'auteur, de celles des copistes; des rapports entre auteur et imprimeurs, compositeurs et correcteurs, etc. Cela ne veut pas dire qu'elle n'est pas signifiante, au contraire, puisqu'elle est en bonne partie libre et personnelle. On peut faire des classements de ces orthographes, à la fois sociaux, géographiques et chronologiques (v. cette étude dans N. Catach 1968: I-XXXIII). Les variantes seront d'autant plus précieuses pour nous qu'elles seront peu usuelles, compatibles avec la prononciation et inscrites dans un projet explicite, individuel ou commun, d'auteur ou d'imprimeur (v. aussi N. Catach à paraitre).

6.1. Variantes fondamentales et variantes accidentelles

On distingue d'ordinaire entre variantes fondamentales et variantes accidentelles (v. déjà Greg 1927). Ces distinctions, toujours en cours, demandent à être sérieusement revues. En particulier, en ce qui concerne les variantes d'orthographe et de ponctuation, que l'on a longtemps méprisées, en les considérant comme relevant d'interventions anonymes et diverses d'ateliers, non de l'auteur, et par conséquent non significatives. On retrouve ici cette trompeuse recherche d'une "vérité" immanente qui serait celle d'un texte ou d'une époque, en réalité la nôtre, et qui nous donnerait le droit d'intervenir sur tout ce que nous ne comprenons pas. Une conception plus moderne considère au contraire le livre, surtout ancien, comme un projet socialisé commun, auteur, éditeur et artisans, respectable en tant que tel sous tous ses aspects. Les "à-côtés" d'un texte sont peut-être ce qu'il a d'essentiel. C'est le cas, précisément, pour la ponctuation, surtout celle de quelqu'un d'aussi vivant et comédien que Diderot.

Je distingue pour ma part, pour le XVIe s. comme pour aujourd'hui, au moins quatre types majeurs de formes susceptibles de variations pertinentes, de façon suffisamment récurrente pour être prises en compte. Il ne s'agit pas de simples lapsus calami, et leur intérêt justifie qu'on les recueille, qu'on les étudie et qu'on les rassemble en microsystèmes paradigmatiques cohérents, en vue d'une lemmatisation partielle ou totale. Trois d'entre elles (les trois premières) sont phonético-graphiques, la dernière concerne la morphosyntaxe (v. Figure 1):

  1. Les alternances vocaliques et consonantiques: il s'agit des alternances phonétiques générales reconnues d'une époque, par exemple, pour le XVIe s., les alternances du type dertre/dartre, sarpe/serpe, doleur/douleur, arrouser/arroser, sée/soie, fourmage/fromage, etc. (v. Figure 4, exemples de règles de traitement de graphies anciennes, et N. Catach et al. 1994, où ces alternances font l'objet de mots et sous-mots de base et sont systématiquement répertoriées en classes et en listes);
  2. Les alternances dites lexicales ou lexicalisées (variantes de prononciation différente), ex. gazonnage/gazonnement, gazouillement/gazouillis, etc.;
  3. Les alternances graphiques (de même prononciation), ex. grolle/grole, appui-main/appuie-main;
  4. Les alternances de formes fléchies proprement dites (flexions nominales ou verbales), vaste secteur de la morphologie orale et écrite, où chacune des catogories précédentes peut se retrouver.
Ces secteurs de variations relèvent de deux types de traitement différents: les unes sont à traiter éventuellement au cas par cas ou par sous-ensembles lexicaux (ex. banals/banaux, finals/finaux, idéals/idéaux, etc.); les autres (la plupart des flexions) sont plus prévisibles et peuvent être traitées en grande partie grâce aux conjugateurs-déclinateurs. Il est préférable d'intégrer les verbes du 3e groupe (les plus variants) et les formes verbales les plus fréquentes directement au lexique.

6.2. Les formes fléchies

Dans cette optique d'un entourage paradigmatique optimal à rechercher, on oublie en effet souvent que la lemmatisation des mots, même reliés entre eux par leurs variantes lexicales et graphiques, est en elle-même tout à fait insuffisante.

Prenons l'exemple des verbes. Dans des dictionnaires comme ceux de R. Estienne (Estienne 1549) ou Nicot (Nicot 1606), on ne trouvera pas forcément l'infinitif du verbe (pas plus que le nom ou l'adjectif d'ailleurs) et toutes ses formes à côté. Leur méthode, meilleure que la nôtre par ailleurs, consiste à donner ligne à ligne en entrées ou en sous-entrées une grande quantité de syngtagmes réalisés, avec diverses formes, y compris les participes, les féminins, etc. Va-t-on renoncer à une telle richesse? On peut ne trouver ainsi tel ou tel verbe que sous telle ou telle forme; va-t-on l'ignorer?

Le problème est qu'on passe ainsi d'emblée, si l'on veut rassembler ces formes sous le lemme, d'une échelle de difficultés à une seconde autrement plus vaste et délicate. Par exemple, que fera l'ordinateur devant les formes suivantes, relevées chez Lanoue 1623, c'est-à-dire un auteur à la fois très variant et réformateur?[9]

[Suite] -- [Retour à la Table des matières]


Notes

9. V. aussi Figure 2 pour avoir et estre chez Cotgrave 1611 et la Figure 3 pour diverses formes verbales relevées chez R. Estienne 1557, Lanoue 1623, Vaugelas 1647, Féraud 1787, etc.