L. Dagenais, L'informatisation du D.C. : Saisie, post-édition et lecture. Conventions

Saisie : conventions et remarques

1. Caractères absents de la table ASCII étendue

1.1. Voyelles accentuées ou à tréma, en capitales et « Ç ». Pour les capitales, nous préservons le « É » ([ALT-144]), « Ç » ([ALT-128]) et, s'il y a lieu, «  Ä » ([ALT-142]), « Ö » ([ALT-153]) et « Ü » ([ALT-154]).

Vu les limitations de la table ASCII, les autres capitales accentuées ou à tréma sont saisies en minuscules, quelle que soit leur taille dans l'imprimé (moyennes ou petites capitales), soit :

1.1.1. Majuscules minusculées à l'initiale absolue de mot : « \ ». Les majuscules minusculées à l'initiale de mot sont précédées de la barre oblique inversée, soit \â, \è, \î, etc. La barre inversée « appartient » au caractère qu'elle accompagne; elle est donc toujours saisie dans la même taille et la même police que le caractère lui-même.

Toute majuscule précédée d'une apostrophe est équivalente à la position initiale de mot et sa minusculation est notée; ex. « l'Âge d'Or » > l'\âge d'Or.

Ailleurs, la minusculation n'est pas notée; c'est dire que les majuscules accentuées qui se trouvent dans le corps d'une vedette, d'une adresse ou d'une sous-adresse sont minusculées sans « \ »; le caractère doit être lu dans la même casse que le mot dans lequel il se trouve; ex. « BRÂS » > BRâS, mais « CAPTIF, ÎVE » > CAPTIF, \îVE.

1.1.2. Le Aprép. > \ൠen toute position. L'imprimeur ne dispose pas du « À » majuscule pour noter la préposition. Pour éviter que l'interrogation traite indistinctement « a » < avoir et la préposition « A » minusculée, nous marquons doublement la préposition : tout Aprép. minusculé est précédé de la barre oblique inverse et assorti du signe de notre intervention (= ajout de l'accent), soit µ [2]. Ex. :

Dans le premier tome, on note un cas où le µ signale la correction d'un « Â »prép. (COULER, 599, §1, l. 6-7 : « Voyez  FOND, [...] »).

1.2. Graphèmes soudés. « Æ » ([ALT-146]) et « æ » ([ALT-145]) sont maintenus. « Œ » et « œ » sont désoudés respectivement en « Oe » et « oe ».

1.3. Tirets de disjonction, simples et doubles. Transposition. Les tirets de disjonction sont de longueur variable dans l'imprimé (leur taille est fonction de la ligne typographique). Nous transposons le tiret simple en tiret souscrit (soit : _ ) et le tiret double en signe d'égalité (soit : =) [3]. Ex. :

Sur la suppression de l'espace devant les signes de ponctuation, cf. §16.1; sur le maintien de l'<ITALIQUE>, §20.1.

1.3.1. Cas d'espèce : trait d'union pour un tiret de disjonction simple. Normalisation : « - » > _. Occasionnellement, l'imprimeur use d'un simple trait d'union en lieu et place du tiret de disjonction simple (de longueur variable). Nous rétablissons systématiquement le tiret souscrit qui transpose le tiret simple de disjonction. Ex. :

2. Codes surnuméraires

On entend par « codes surnuméraires » des codes introduits erronément, en l'absence de caractères entre leur ouverture et leur fermeture. Il faut être très attentif à ne pas en insérer : ils ralentiraient le traitement automatique ultérieur et, plus grave, fausseraient les inventaires subséquents. Ex. :

Nous tenons aussi pour surnuméraires les codes inutilement interrompus et réactivés. Cf. les §§ « principe d'économie » (§§16.4, 18.6, 19.5 et 20.7).

3. Disposition : lettre de section alphabétique, vedette, première adresse

3.1. Conventions. Les lettres en tête des sections alphabétiques (A, B, C...) sont centrées (comme dans l'imprimé), saisies en capitales de taille <EXTRA LARGE>, précédées et suivies de trois [RET], les second et troisième correspondant chacun à une ligne vierge.

Entre deux articles, on insère une ligne vierge. La vedette est donc séparée de l'article précédent par deux [RET]. On l'aligne sur la marge de gauche (c'est-à-dire qu'elle n'est jamais précédée d'un [TAB]) et on la sépare de l'adresse qui la suit par [TAB]. On la saisit en capitales de taille <TRÈS LARGE>. La première adresse suit la vedette. Elle est précédée d'un [TAB] et saisie en capitales de taille <LARGE>. Ex. :

Sur la taille de la vedette et des adresses, cf. aussi §§17.2 et 17.3.1; sur la suppression de l'espace devant les signes de ponctuation, §16.1.

3.2. Rejet : les repères alphabétiques. Nous ne saisissons pas les repères alphabétiques (séquences de trois caractères en majuscules moyennes) qui surmontent chacune des colonnes dans l'imprimé. Ils signalent respectivement les trois premiers caractères de la première et de la dernière vedette qui figurent sur la page. Ex. :

3.3. Rejet : les repères occasionnels en bas de page. Nous ne saisissons pas les indications occasionnelles qui figurent sous les colonnes de l'imprimé. Ex. :

4. Tome, page et colonne de l'imprimé

4.1. Conventions. Nous signalons tout changement de tome, de page et de colonne dans l'imprimé par un marqueur {TOME.PAGE.COLONNE} inscrit entre accolades et qui compte toujours le même nombre de caractères.

Le D.C. compte trois tomes; le premier est noté A, le second B et le troisième C. Chaque tome est paginé à partir de 1. Toute page est notée par trois caractères, soit 001, 010, 100. L'indication de colonne suit : celle de gauche est notée a, celle de droite, b.

Le début de la colonne de gauche de la page 38 du tome 2 se lit donc : {B038a} (qui deviendra {b038a} à l'indexation).

4.2. Position du marqueur {TOME.PAGE.COLONNE} : principe général. Le marqueur est isolé du texte qui l'environne : il s'agit d'éviter qu'il se soude à un mot au moment de l'indexation. Le marqueur sera lui-même indexé, ce qui permettra de vérifier sa présence dans le texte.

4.2.1. Changement de page/colonne entre deux mots entiers ou devant un non-mot. [4] On saisit le marqueur entre deux blancs, à l'intérieur d'un attribut de taille ou de police s'il y a lieu. Ex. (incluant les conventions explicitées dans la suite) :

4.2.2. Changement de page/colonne avec paragraphe en retrait ou changement d'article concomitant. Quand la page ou la colonne commence avec un paragraphe en retrait ou avec un nouvel article, on inscrit le marqueur à la suite du dernier caractère de la page/colonne précédente [5], séparé de celui-ci par un espace. La combinaison de l'espace et du [RET] isolera le marqueur à l'indexation. Ex. (incluant les conventions explicitées dans la suite) :

4.2.3. Changement de page/colonne en présence d'un tiret de césure. Nous sommes convenus d'ignorer l'attribut ligne de l'imprimé et d'indiquer les changements de page/colonne à la suite d'un mot complet. On saisit le marqueur entre deux espaces, à droite du mot reconstitué [6] (et, s'il y a lieu, à droite de ses attributs de taille et de police de même qu'à droite d'un signe de ponctuation). Ex. (incluant les conventions explicitées dans la suite) :

Sur la césure, cf. aussi §10.1.

4.2.4. Changement de page/colonne en présence d'un trait d'union. Du point de vue linguistique, le « trait d'union » a deux statuts : soit il n'est que trait d'union d'enclise (ex. croyez-vous que... ?), et nous le considérons comme délimiteur dans l'indexation (de sorte que les mots de part et d'autre seront séparés; dans l'exemple précédent, croyez et vous, chacun dans son ordre alphabétique), soit le trait d'union soude les éléments d'un mot composé et l'indexation, pour être optimale, doit le traiter comme un caractère (le mot composé sera alors constitué en unité à part entière); pour le détail du traitement, dont le doublement du trait d'union dans tous les cas douteux, cf. §10.

Dans le premier tome, aucun changement de page/colonne n'opère sur un cas d'enclise assurée (il s'agirait essentiellement des cas d'inversion de pronoms). Mais dans tous les cas, nous saisirions le marqueur à droite de la séquence complète et le ferions précéder et suivre d'un espace. Ex. virtuels :

Pour repérer aisément les changements de page/colonne qui opèrent sur un trait d'union dont le statut de délimiteur, de caractère ou de césure ne sera décidable qu'à la fin du traitement, nous doublons systématiquement le trait d'union dans tous ces cas (soit : --). Il suffira, après l'indexation de l'ensemble du texte, de revenir sur quelques-uns des marqueurs de page dont la position pourrait être affectée. Pour l'instant, nous convenons de saisir le marqueur à droite du mot « complet », de sa taille, de sa police et de sa ponctuation s'il y a lieu, que son statut de mot composé soit ou non clair ou que, par prudence, nous estimions discutable une décision a priori sur le statut de césure du trait d'union de l'imprimé.

Nous avons en conséquence traité les neuf cas problématiques du Tome 1 comme suit :

Sur les « traits d'union », cf. §10.2, 10.3.

4.2.5. Changement de page/colonne en présence d'un tiret de syllabification. Nous sommes convenus de préserver l'intégrité des mots phonétiques que Féraud note assez régulièrement dans le composant phonético-graphique de ses articles. Nous traitons les traits d'union qui y transposent (partiellement) la syllabification de la même façon que les traits d'union dont le statut en fin de ligne est mitigé (cf. §4.2.4). Ex. (incluant les conventions explicitées dans la suite) :

Sur le tiret de syllabification, cf. §10.4.

4.3. Cas d'espèce : changement de page/colonne entre des guillemets et un mot. Normalisation : marqueur {TOME.PAGE.COLONNE} + guillemets. Dans le D.C., les signes de ponctuation (à l'exclusion du point), les parenthèses, l'astérisque et les crochets sont précédés et suivis d'un espace. Nous supprimons l'un ou l'autre selon le cas (cf. §§16.1 et 16.2 pour le détail). Un changement de page/colonne peut donc se produire dans l'interstice. C'est notamment le cas dans le Tome 1 : en deux occasions (697-698 et 727-728), le changement se produit entre des guillemets ouvrants et le mot qui suit. Puisque nous collons systématiquement les guillemets sur le mot suivant, nous avons inscrit le marqueur à leur gauche, soit :

[Table des matières] [Suite]


Notes

2. Sur l'usage de µ, cf. la section « Orthographe, typographie ».

3. Nous reproduisons ici le tiret simple par deux tirets successifs, le tiret double par deux signes d'égalité successifs (soit : « ¯¯ » et « == »).

4. Soit : crochet ouvrant, chiffre, guillemets, astérisque ou tiret (simple/double) de disjonction.

5. Très généralement, il s'agit d'un point et le marqueur n'est donc pas affecté d'un attribut de taille ou de police. Il peut toutefois l'être quand le changement de page/colonne coïncide avec un changement de vers à l'intérieur d'une citation. Ex. :

Sur la saisie des vers, cf. §5.3.

6. Bien entendu, tous les mots « composés » de statut douteux seront revus en fin de parcours et les correctifs nécessaires seront apportés à la position du marqueur s'il y a lieu.