L. Dagenais, L'informatisation du D.C. : Saisie, post-édition et lecture. Conventions

5. Disposition de l'article

5.1. Transposition de l'alinéa : [TAB]. Dans l'imprimé, la première adresse (qui correspond aussi à la vedette) est alignée sur le troisième caractère, comme le sont les paragraphes à l'intérieur de l'article. Nous transposons tous ces retraits par [TAB] (c'est pourquoi on sépare la vedette de la première adresse par [TAB]; cf. §3.1).

5.2. Changements d'alinéa. Nous respectons les changements d'alinéa sans normaliser la pratique un peu désordonnée du lexicographe ou de l'imprimeur. Ex. :

5.3. Normalisation de la position des citations en vers par rapport à la marge de gauche : [TAB]. Dans le texte imprimé, les citations en vers se présentent en retrait, alignées sur l'alinéa (et toujours en taille <PETIT>; cf. §§17.5.1 et 18.1). Nous faisons donc précéder chaque vers d'un [TAB].

Nous normalisons l'alignement des vers chaque fois que nécessaire. Ex. :

Sur la suppression de l'espace devant les signes de ponctuation, cf. §16.1.

5.4. Normalisation de la position des noms d'auteurs ou d'oeuvres à la suite des citations en vers : [Appui droite]. Le plus souvent, les noms d'auteurs et d'oeuvres (incluant Id. et Ibid.) suivent la citation en vers. Nous les faisons précéder d'[Appui droite] (sans [TAB]), sur la ligne qu'ils occupent dans l'imprimé (celle du dernier vers ou la suivante), conformément à la police (cf. §20.1) et à la taille, moyenne ou <PETIT> (cf. §18.1) dans lesquelles ils se présentent. Ex. :

Sur la suppression de l'espace devant les signes de ponctuation, cf. §16.1.

Sur l'ordre du codage, <POSITION> + <TAILLE> + <POLICE>, cf. §21.3.

6. Guillemets

6.1. Descriptif. Dans l'imprimé, les guillemets ont la forme de guillemets fermants (« " ») et ils sont séparés du premier caractère qui les suit par un espace, que nous éliminons. Ils servent exclusivement à introduire une citation (qui peut se limiter à un exemple très simple), référencée ou non, sans jamais en baliser la fin. Nous les transposons en guillemets droits. Ex. :

Sur la taille des adresses, cf. §§3.1 et 17.3.1; sur la suppression de l'espace devant les signes de ponctuation, §16.1 et sur le point abréviatif, §13.

6.2. Cas d'espèce sans normalisation : guillemets devant un tiret de disjonction. On a pour l'instant trouvé un cas où les guillemets précèdent un tiret de disjonction et non la citation elle-même. Les guillemets sont donc collés à ce signe (soit : le premier caractère qui suit les guillemets) :

6.3. <ITALIQUE> non pertinente (hormis citations en vers). Les guillemets ne se présentent jamais en italique dans l'imprimé. Ils sont donc toujours saisis à l'extérieur du code de police : que le mot qui précède ou celui qui suit soit en italique ne les affecte pas.

Toutefois, ils seraient forcément saisis à l'intérieur de la police italique s'ils se trouvaient dans une citation en vers entièrement en <ITALIQUE>. Sur les conventions de saisie des citations en vers, cf. §§5.3, 17.5.1 et 18.1.

6.4. Taille non pertinente (hormis citations en vers). Les guillemets se présentent en taille moyenne. Ils sont donc toujours saisis à l'extérieur des codes de taille : que le mot qui précède ou celui qui suit soit affecté d'une taille particulière ne les affecte pas.

Toutefois, ils seraient forcément saisis à l'intérieur de la taille <PETIT> s'ils se trouvaient dans une citation en vers. Sur les conventions de saisie des citations en vers, cf. §§5.3, 17.5.1 et 18.1.

7. Chiffres

L'imprimeur n'utilise jamais le « 1 » arabe (même pour la pagination).

7.1. Transposition du « I » romain en « 1 ». Nous remplaçons « I » par « 1 » dans les cas où la numérotation se poursuit en chiffres arabes (soit : pour la numérotation des syllabes dans le commentaire phonético-graphique et pour celle de différentes acceptions d'un lexème).

7.2. Maintien des chiffres romains. Nous maintenons les chiffres romains quand ils appartiennent à une série en romains (séries peu fréquentes d'ailleurs; ex. CHAUFAGE, CHAÛD, QUE [7]), quand ils accompagnent la référence à un volume donné d'un livre ou à divers noms et quand ils correspondent à un renvoi noté ainsi dans le D.C. Ex. :

Dans le cas des renvois internes au D.C., la vérification systématique dans l'original impose le choix : selon que ce « I » appartient à une série en chiffres romains ou en chiffres arabes, on le saisit en conséquence.

Sur les chiffres cardinaux suivis d'un point, cf. §13.1.1.

7.3. <ITALIQUE> non pertinente (hormis titre d'oeuvre d'une citation en vers). Nous n'avons pas encore trouvé de chiffre en italique. On pourrait toutefois imaginer que la citation de Rousseau (cf. CARACTÈRE ci-dessus) se présente ainsi : "Liv. I , Ode", avec le chiffre romain en italique. On saisirait alors comme suit  :

Si "Ode" se trouvait aussi en italique, il faudrait réouvrir le code (de sorte à inclure le point abréviatif à l'intérieur de l'italique mais à en exclure la virgule; cf. §16.4.2, soit : Sur la saisie des noms d'auteurs et d'oeuvres, cf. §§5.4, 17.5.1, 18.1, 18.4 et 21.1; sur le point abréviatif, §13.

7.4. Taille non pertinente (hormis citations et titre d'oeuvre d'une citation en vers). Les chiffres se présentent très généralement en taille <PETIT>, attribut de l'imprimé que nous ignorons. Ex. CHACUN, « IV » > IV.

Toutefois, les chiffres seraient forcément saisis à l'intérieur de l'attribut <PETIT> s'ils se trouvaient dans une citation en vers ou dans un titre d'oeuvre lui-même en taille <PETIT> (cf. §18.6). Sur le même principe que l'<ITALIQUE> (cf. §7.3), on peut imaginer la citation de Rousseau se présentant ainsi : "Liv. I, Ode"; on saisirait alors :

Sur la saisie des noms d'auteurs et d'oeuvres, cf. §§5.4, 16.4.1, 17.4.1, 17.4.3, 17.5.1, 17.5.2, 18.1, 18.4 et 21.1; sur le point abréviatif, §13.

8. Attribut <EXPOSANT>

8.1. Maintien général. Nous préservons partout les caractères en exposant. L'attribut est récurrent dans l'énumération des syllabes, des lettres ou des sons, c'est-à-dire dans le composant phonético-graphique. On y sera donc très attentif. Ex. :

On le trouve aussi ailleurs, très occasionnellement; ex. : CAÛTELEUX, l. 16 . : « Mr... ».

Sur la taille des chiffres, cf. §7.4; sur la concomitance du point abréviatif et des points de suspension, §13.2.

8.2. Maintien de « ° »

8.2.1. Dans la numérotation. Nous maintenons le « ° » qui se trouve en position exposant dans l'énumération de différentes acceptions et remarques. Ex. :

Sur la suppression de l'espace devant les signes de ponctuation, cf. SAISIE..., §16.1; sur les chiffres rétablis en taille normale, §7.4; sur la taille de l'intitulé « REM. », §17.4.1 et sur le point abréviatif, §13.

8.2.2. Dans l'abréviation « n°. ~ n°. ». Ex. :

9. L'astérisque

Féraud recourt fréquemment à l'astérisque pour signaler le « mauvais usage » (lexème qu'il condamne, constructions blâmables, etc.).

9.1. « * » et capitales de taille <LARGE> (adresses, renvois, reprises d'adresses et sous-adresses). Quand l'astérisque précède un lexème transposé en capitales larges (< petites capitales de l'imprimé), nous le collons sur le lexème, à l'intérieur du code <LARGE>. Ex. :

« * ADOLÉCENCE , ADOLÉCENT , Richelet. Voy. [...] »
=
[TAB][LARGE]*ADOLÉCENCE[Large], [LARGE]ADOLÉCENT[Large], Richelet. Voy· [...]

Sur la transposition des adresses, des renvois, etc., cf. §17.3; sur l'interruption des codes de taille et de police devant les virgules, §§16.4 et 16.4.2; sur la suppression de l'espace devant un signe de ponctuation, §16.1; sur le point abréviatif, §13.

Cette convention ne préjuge en rien de la portée de l'astérisque; ainsi, dans l'exemple qui précède, il est clair qu'elle vaut tant pour la seconde adresse que pour la première. Ce n'est généralement pas le cas; cf. l'exemple qui suit, où seul le verbe est visé :

On aura compris que l'astérisque n'est jamais saisi au niveau de la vedette.

9.1.1. « * » et capitales de taille <LARGE> en <ITALIQUE>. S'il se trouvait des cas de superposition de taille et de police, les deux attributs précéderaient, dans cet ordre, l'astérisque. C'est dire que nous respectons en toute situation le principe de coller l'astérisque directement sur les lexèmes qui se présentent dans la taille <LARGE>. Sur la taille des adresses, des renvois, etc., cf. §17.3; sur <LARGE>, §19; sur <ITALIQUE> §20 et sur l'ordre des attributs <TAILLE> + <POLICE>, §§21.1 et 21.2.

9.2. « * » et citations en vers. Le principe de l'espace entre l'astérisque et la citation en vers reste valide. Si un astérisque précédait le premier vers, on le saisirait à l'extérieur du code <PETIT> qui l'introduit. Mais, comme pour les cas virtuels de guillemets et de chiffres internes à une citation en vers, on saisirait l'astérisque à l'intérieur du code <PETIT> s'il se trouvait à l'intérieur de la citation. Ex. virtuel : « * » devant le deuxième vers de la citation :

Sur la suppression de l'espace devant les signes de ponctuation, cf. §16.1.

9.3. Ailleurs. Hormis les cas décrits ci-dessus (§§9.1 et 9.2), nous saisissons l'astérisque tel qu'il se présente, en préservant l'espace qui le sépare de ce qu'il précède et sans l'inclure à l'intérieur des codes quand il s'en présente immédiatement à sa suite, tel qu'illustré dans les premiers exemples :

Sur le point abréviatif, cf. §13; sur la transposition du long tiret de disjonction, cf. §1.3; sur la suppression de l'espace devant les signes de ponctuation, §16.1; sur les guillemets, §6 et sur les guillemets à un changement de page/colonne, §4.3.

10. « Traits d'union » : l'imprimé

Le trait d'union de l'imprimé sert à quatre choses :

Nous dirons le premier césure, le deuxième trait d'union, le troisième trait d'union d'enclise et le dernier tiret de syllabification. Le traitement de chacun de ces « traits d'union » vise à garantir au mieux l'intégrité des mots simples, des mots graphiques composés et des mots phonétiques aux fins de l'indexation.

Pour profiter maximalement de l'indexation, nous ignorons les césures évidentes. Nous saisissons les autres « traits d'union » de l'imprimé (traits d'union de mots graphiques, traits d'union d'enclise, tirets de syllabification et les césures incertaines) comme un trait d'union standard, que nous déclarerons caractère et non délimiteur. À l'étape finale de l'indexation, nous statuerons sur les traits d'union d'enclise et les césures douteuses; nous remplacerons le trait d'union d'enclise par un délimiteur et rétablirons le mot dans le cas des césures. Nous préserverons par ailleurs le statut de caractère aux traits d'union des mots composés et des mots phonétiques qui seront ainsi indexés comme des entités au même titre que les mots simples. Ex. :

Sur la suppression de l'espace devant les signes de ponctuation, cf. §16.1.

10.1. Césure. Le texte est saisi sans préserver l'attribut « ligne » de l'imprimé. Dans cet esprit, nous ne saisissons donc pas les « traits d'union » de césure qui se trouvent dans l'imprimé. Nous restituons dans les cas tout à fait transparents le mot fragmenté dans l'imprimé, sans laisser trace de notre intervention. Ex. :

10.2. Traits d'union d'enclise. Jusqu'à l'indexation finale, nous ne tenons pour trait d'union d'enclise assuré que celui présent en cas d'inversion pronominale. Ex. :

Les traits d'union d'enclise seront ultérieurement traités comme des délimiteurs.

Sur la suppression de l'espace devant les signes de ponctuation, cf. §16.1.

10.3. Césures douteuses, traits d'union d'enclise incertains et traits d'union en fin de ligne de l'imprimé : doublement (soit : --). Dans tous les cas où le statut de césure n'est pas absolument sûr, nous doublons le trait d'union saisi [8]. (Cette tâche revient aux chercheurs et non aux clavistes.) Il s'agit essentiellement d'éviter un biais dans le décompte des diverses graphies. Nous aurons donc une idée nette de la distribution des variantes à trait(s) d'union vs à éléments soudés vs à éléments séparés par des espaces; ex. (en partie) virtuels : « sur-tout » [9] vs « surtout » [10] vs « sur tout » [11]; « peut-être » [12] vs "peutêtre" vs « peut être » [13]. Ex. :

Pour le traitement de la césure et des traits d'union en présence d'un changement de page/colonne, cf. §§4.2.3 et 4.2.4.

10.4. Tirets de syllabification en fin de ligne de l'imprimé : doublement systématique (soit : --). Les clavistes doublent systématiquement les tirets de syllabification qui se trouvent en fin de ligne dans l'imprimé. Ce double « trait d'union » sera maintenu dans l'édition électronique car rien n'autorise la normalisation de la syllabification (alors qu'on peut déjà imaginer la normalisation de la plupart des mots « graphiques » en faveur d'un seul trait d'union sur la foi de l'ensemble des occurrences du mot).

Illustration. Quand on lit sur la même ligne dans l'imprimé : « al-légori-zeur » (84, col. dr., l.1) , on sait que Féraud a isolé deux syllabes : « al » et « zeur », mais si « zeur » s'était trouvé sur la ligne suivante, on n'aurait pu affirmer que le tiret de fin de ligne typographique est l'équivalent du tiret de syllabification. La contrainte matérielle de la fin de ligne typographique peut créer une syllabification fortuite. Inversement, Féraud écrit « légori » en un seul bloc, sans signaler la syllabification, mais si "" ou "go" s'était trouvé en fin de ligne typographique, l'imprimeur aurait forcément introduit un tiret de fin de ligne typographique qui, c'est clair, ne ressortirait pas aux indications métalinguistiques de l'auteur sur la syllabification. Ex. :

Sur la suppression de l'espace devant les signes de ponctuation, cf. §16.1 et sur le traitement du tiret de syllabification en présence d'un changement de page/colonne, cf. §4.2.5. Sur le rétablissement des tirets de syllabification en présence d'un espace dans l'imprimé, cf. section ORTHOGRAPHE..., §1.2.

11. « Traits d'union »: normalisation de l'environnement

Dans l'imprimé, les « traits d'union » de tous les types (traits d'union de mots graphiques, traits d'union d'enclise et tirets de syllabification) se trouvent parfois entre deux espaces ou avec un espace avant ou après. Nous normalisons leur environnement et les saisissons dans tous les cas sans espace de part et d'autre. Ex. :

12. Tirets de dialogue (?)

Dans certaines citations en vers, des tirets de l'imprimé (généralement plus courts que les traits d'union) semblent remplir le rôle de tirets de dialogue. Toutefois, on en trouve jusqu'à trois consécutifs, ce qu'il reste à interpréter (leur nombre coïncide parfois avec celui des tours de parole mais on ne peut exclure qu'ils signalent l'omission d'un passage dans la citation). Ces tirets sont saisis comme des traits d'union mais, pour les distinguer des traits d'union de l'orthographe, nous les isolons par un espace à droite. Ex. :

Sur les conventions de saisie des citations en vers, cf. §
5.3 et sur la suppression de l'espace devant les signes de ponctuation, §16.1.

13. Point abréviatif (« · » [ALT-249])

Nous saisissons le point abréviatif différemment du point de ponctuation et des points de suspension.

13.1. Point abréviatif (« · » [ALT-249]) et point de ponctuation (« . » standard). L'indexation devra fournir la liste complète des abréviations qui se trouvent dans le D.C. En conséquence, nous traitons le point abréviatif comme un caractère (non délimiteur), faisant partie intégrante de l'abréviation, contrairement au point de ponctuation qui agit comme délimiteur, au même titre que tous les signes de ponctuation, et qui n'apparaît donc pas dans l'index. On saisira donc différemment le point abréviatif et le point de ponctuation, soit :

On aura compris que le choix de noter « · » assure la visibilité du point abréviatif pour fins de relecture.

13.1.1. Ordinaux et point abréviatif (« · » [ALT-249]). Cardinaux, « ° » et points de ponctuation. Nous tenons pour abréviatif le point qui suit les ordinaux. Ex. :

Nous tenons pour un point de ponctuation celui qui suit immédiatement les chiffres (ex. III.) ou « ° » (ex. 2°.).

Sur la transposition du « I » romain, cf. §7.1 et sur la taille des chiffres, §7.4; sur la suppression de l'espace derrière/devant les parenthèses et devant les signes de ponctuation, §16.1; sur la préséance du point abréviatif sur le point de ponctuation, §15.4.

13.2. Point abréviatif (« · » [ALT-249]) et points de suspension. Quand le premier point de suspension peut jouer le rôle d'un point abréviatif, nous donnons préséance au statut de point abréviatif. Ex. :

Sur les points de suspension en nombre variable dans l'imprimé, cf. §16.2.

14. C'est-à-dire

Sous une forme abrégée, « c'est-à-dire » est omniprésent dans le D.C. Le plus souvent, on lit « c. à. d. ». Pour retrouver cette abréviation (très fréquente) dans l'index des formes, nous convenons d'utiliser le point abréviatif (« · » [ALT-249]) même après la simple préposition « à ». On saisira donc « c. à. d. » comme suit :

c· à· d·
=
c[ALT-249] à[ALT-249] d[ALT-249]

L'espace étant un délimiteur, nous envisageons un traitement particulier de l'abréviation à l'étape finale de sorte à l'indexer sous sa forme abrégée complète.

14.1. Maintien de « c.à.d. ». Nous maintiendrons la notation sans espaces s'il y a lieu puisqu'elle ne gêne en rien l'indexation de l'abréviation complète (avec points abréviatifs).

14.2. Normalisation de toute autre abréviation de « c'est-à-dire ». Toute autre notation de l'abréviation, notamment « c. à d. », sera normalisée en <c· à· d·> aux fins de l'indexation, sans trace de notre intervention.

[Table des matières] [Suite]


Notes

7. Le « I » est parfois absent; cf. l'article CE (376-382) qui compte pourtant les grandes divisions « II », « III » et « IV »; cf. aussi COMPLEXION (505) où on lit « II », COMPTE (511-512), numéroté de « II » à « VIII ».

Nous maintenons les erreurs de numérotation, même quand elles impliquent le passage d'une numérotation en chiffres arabes à une numérotation en chiffres romains; c'est le cas notamment dans le macro-article ÊTRE (« v. auxil. et substantif. ») (T. 2, 173-176), subdivisé comme suit : « Rem. » de « 1° » à « 5° » (173), puis passage à la numérotation en romains à la page suivante (jusqu'à la fin de l'article), soit : « VI » à « IX ». Cf. aussi Annexe 2, §17.

8. Nous ne tenons pas toutes les césures pour douteuses. Par ex., nous la doublons dans « quelque-fois » > quelque--fois mais non dans « quel-quefois » (> quelquefois) ou dans « quel-qu'un » (> quelqu'un).

9. Cf. ANALYSE, l. 12-13 : « Il se dit sur-tout dans cette dernière acception ; pour l'autre , [...] ».

10. Cf. ARCHET, col. dr., l. 5-7 : « passer sous l'archet , se dit pour suer , surtout de ceux qui passent par les grands remèdes. »

11. Cf. CALER, l. 9-12 : « J'avoûe que je l'aimerais mieux que caler la voile , comme dit l'Acad. et sur tout , que caler les voiles , comme dit le Rich. Port. ». Noter l'homographe possible : APATHIQUE, l. 2 : « Qui est insensible sur tout. »

12. Cf. CALEMBOURG, l. 10-12 : « L'ortographe de ce mot n'est pas encôre fixée , et peut-être disparoîtra-t-il avant qu'elle le soit. »

13. Cf. CE, (376-)381, 11°, l. 3-5 : « Plusieurs Auteurs mettent le subjonctif , peut être à cause du superlatif , [...] ». Noter l'homographe possible : BRAVOÛRE, l. 5 : « Cela ne peut être bon que dans... ».