Arlette Attali

Le catalogue critique des ressources textuelles sur internet (CCRTI)

1- Objet du catalogue :

Le CCRTI, mis en ligne en octobre 1999, recense, analyse et évalue à partir de critères préalablement définis, des sites sélectionnés qui diffusent en libre accès sur la Toile des textes appartenant au patrimoine littéraire francophone du Moyen Âge à nos jours. Il s'agit donc d'un site qui porte sur des contenus et non sur des recherches littéraires.

Son but premier est de répondre à une attente des internautes, qu'ils soient chercheurs, étudiants ou simples curieux, désireux de s'y retrouver devant la prolifération sur le réseau de sites éditeurs ou diffuseurs de ressources textuelles tout particulièrement dans le domaine littéraire. Le lecteur est en effet confronté à une masse de documents livrés en vrac, et les moteurs de recherche spécialisés tels Aleph, La porte des Lettres, Ulysse…, sont trop peu nombreux et en outre, en tout cas pour le moment, ils ne proposent pas de sélections affinées. Certes, quelques répertoires sont accompagnés de résumés, de commentaires et même d'étoiles, comme dans un guide touristique, mais ces informations, le plus souvent trop succinctes ou subjectives, n'apportent rien de vraiment significatif quant à la valeur éditoriale, littéraire et scientifique des sites et à la fiabilité de leur contenu.

Ce catalogue électronique a donc pour objectif d'être un véritable outil de recherche qui donne à l'internaute à la fois des repères lui permettant d'accéder rapidement à des sites sélectionnés, vérifiés et analysés et aussi des critères qui lui permettent de juger de la validité et de l'intégrité des ressources qu'ils contiennent.

2 - Comment a été réalisé le CCRTI

2-1 Sélection et choix des sites :

Le but étant de répertorier les sites qui offrent le maximum de fiabilité tant sur le plan éditorial que numérique des textes, les sites sélectionnés en priorité sont :

  • les sites rattachés à de grandes institutions telles que les universités, les centres de recherche, les ministères, les centres culturels. En matière de traitement éditorial, d'authentification des textes et de sécurisation des données, on peut leur accorder une certaine confiance.
  • les sites relevant d'initiatives privées à caractère nettement scientifique, pédagogique ou culturel.
  • Ils ont en commun d'être d'une part clairement identifiables (nom du responsable du site, son adresse etc.) et d'autre part de diffuser des textes majoritairement intégraux soit à partir de leur propre serveur soit par hyperliens.

    2-2 Organisation du Catalogue

    Les sites sont classés en deux grandes catégories :

    A) Les bibliothèques de littérature générale :

    Elles regroupent trois sortes de sites : [Voir la page d'accueil de la bibliothèque générale]

    a) les sites généralistes qui diffusent des ouvrages de toutes époques et de tous genres littéraires. [exemple ATHENA]
    b) les sites généralistes mais consacrés à une époque spécifique (Moyen Âge, 17e siècle…) [Ex. Centre d'Études des Textes Médiévaux]
    c) les sites dédiés à un genre littéraire (contes, théâtre, poésie…). [Ex. Le théâtre de la foire à Paris].

    Actuellement 39 sites sont indexés pour les bibliothèques de littérature générale

    B) Les bibliothèques d'auteurs :

    Elles recouvrent les sites dédiés à un auteur ou à une œuvre littéraire. [Voir la page d'accueil Auteurs]

    Nombre de sites indexés actuellement : 45

    Au total le catalogue comprend 84 sites répertoriés, analysés et indexés

    3 - Description des sites : Les grilles d'évaluation

    Pour analyser et expertiser les sites des grilles ont été mises au point. Elles se présentent sous forme de formulaires ou fiches descriptives . Il y a un modèle de fiche par type de bibliothèque. [Voir la page grilles : http://lcp.damesme.cnrs.fr/ccrti/fiche-auteur.cfm ; http://lcp.damesme.cnrs.fr/ccrti/fiche-general.cfm].

    Ces grilles sont constituées de rubriques qui permettent de donner une description objective des sites d'après des critères formels, extrinsèques.

    L'élaboration de ces fiches s'inspire des notices classiques des catalogues des bibliothèques traditionnelles, mais adaptée à ce nouveau média qu'est l'internet avec toutes les possibilités qu'il offre.

    4 - Analyse des critères retenus dans les grilles d'évaluations

    Ils se répartissent en quatre rubriques : [Présentation de ces rubriques à partir de la fiche descriptive de la BM de Lisieux]

    A) l'identification du site

    1- Adresse Internet : http://www.bmlisieux.com

    2- le lieu géographique où est situé le serveur (afin de prévenir l'internaute des risques d'encombrements de réseau qu'il peut rencontrer en se connectant à certaines heures, sur des sites basés aux USA ou au Japon par ex.), [France]

    Statistiques à partir du CCRTI :
    . Sur 84 sites,
    France : 47
    Canada : 14
    RU 7
    USA : 6
    AUTRES : 9 (Israël, Japon, Pays Bas, Suisse, Allemagne, Italie, Portugal

    3 - Est signalé en outre s'il s'agit d'un site individuel ou d'un site rattaché à une institution et dans ce cas le nom est mentionné [Bibliothèque municipale de Lisieux]

    Statistiques :
    Sites individuels : 37 (essentiellement des sites consacrés à des Auteurs)
    Sites institutionnels : 47

    4 - la langue de l'interface (ce critère est important car, en effet, une bonne compréhension du contenu de l'interface permet une bonne approche du texte diffusé). [Langue de l'interface du site : Français.]

    Statistiques :
    uniquement en français : 63
    Uniquement en anglais : 5
    Anglais-français : 11
    Autres langues : 5 (Néerlandais, italien, portugais, latin)

    5 - Nom du Responsable du site : Olivier Bogros et son adresse électronique (Bmlisieux@mail.cpod.fr).

    B) la typologie des ressources textuelles

    Type de bibliothèque : Bibliothèque générale.

  • Spécification du genre littéraire
  • Le site présente ses propres versions électroniques des textes ou renvoie-t-il à des hyperliens
  • Méta-catalogue de ressources textuelles : présence d'une liste de liens vers d'autres sites.
  • La présence éventuelle de traductions, soit de textes français traduits en langue étrangère soit de textes étrangers traduits par un auteur français, par exemple Poe traduit par Baudelaire. Cette indication permet de mener des études comparatives.
  • C) Traitement éditorial des textes :

    Les critères énoncés dans cette rubrique sont très importants en particulier pour un chercheur soucieux de fiabilité sur le plan philologique :

  • La mention du caractère intégral ou non de tous les textes en ligne. D'une manière générale, les sites sélectionnés dans le Catalogue ne proposent que des textes intégraux, mais il peut arriver que certains diffusent aussi des extraits et cela doit être précisé. [Tous les textes sont intégraux].
  • Statistiques
    50 sites présentent des textes intégraux. Les autres sont un mélange de textes intégraux et d'extraits

  • L'indication de la référence à l'édition source ou au manuscrit (lorsqu'il s'agit d'édition de ms). Ce critère est tout à fait essentiel. Il est la marque de la valeur scientifique d'un site. Malheureusement, la référence à l'édition numérisée est trop souvent absente et cela pour plusieurs raisons : soit les auteurs de sites utilisent des éditions sous droit, soit ils font une compilation de plusieurs éditions, soit ils plagient d'autres sites… [La référence à l'édition papier ou à la source numérisées est indiquée].
  • Statistiques :
    sur 84 sites indexés, 39 seulement indiquent la source.

  • La notation de la pagination de l'édition papier numérisée. Elle devrait aller de pair avec la référence à l'édition, mais c'est loin d'être toujours le cas. [La pagination de l'édition papier ou à la source numérisées n'est pas indiquée].
  • Les dates biographiques des auteurs [Les dates biographiques des auteurs sont indiquées].
  • Statistiques :
    57 sites donnent les dates biographiques des auteurs

  • La date de publication des textes [La date de publication des textes est indiquée].
  • Statistiques :
    59 sites donnent une indication de date de publication des textes

  • La présence d'une notice bibliographique [Le site présente des notices bibliographiques pour certains textes].
  • Statistiques :
    44 sites proposent des notices biblio

    Ces trois derniers critères nous paraissent indispensables pour pouvoir situer les textes dans le temps, éviter des anachronismes et pour donner une perspective historique aux lecteurs.

    D) Traitement numérique des ressources :

    Certains critères portent sur des aspects purement techniques :

  • L'indication du mode de saisie du texte : mode texte, mode image ou les deux. [Les textes ont été saisis au format texte].
  • L'indication du mode de navigation HTML qui permet au lecteur de savoir si la consultation des textes se fait sur une ou plusieurs pages. [Les textes sont présentés sur une seule page].
  • Statistiques : format texte : 58
    Format image : 7
    Les autres : mixtes

  • Indication de présence éventuelle d'un logiciel de téléchargement des textes et son nom. [Le site ne propose pas de mode de téléchargement].
  • Statistiques :
    19 sites proposent un mode de téléchargement (PDF, RTF, Word…)

    Enfin les derniers critères prennent en compte la forte valeur ajoutée d'un site :

  • La présence de notes hypertextuelles à l'intérieur des textes. [Pas de notes hypertextuelles]
  • Statistiques :
    23 sites seulement sont enrichis de notes hypertextuelles.

  • Présence d'outils tels que : moteurs de recherche, dictionnaires, lexiques, grammaires etc., sur le site ou accessibles par hyperliens. [Le site propose un outil de recherche et d'analyse.(LexTor)]
  • Statistiques :
    25 sites proposent des outils de recherche . Généralement des moteur de recherche par mots.

  • La présentation des textes dans un environnement multimédia : photographies, illustrations, son, vidéo… [Les textes n'ont pas d'environnement multimédia] .
  • Statistiques :
    28 sites proposent des illustrations : photographies, reproductions de peinture, dessins…

    5 - L'outil d'interrogation et de recherche sur le site CCRTI

    Les informations recueillies grâce aux grilles d'évaluation sont organisées dans une base de données. L'internaute peut ainsi faire des requêtes affinées et personnalisées grâce aux critères qui lui sont proposés et qu'il peut sélectionner. Parmi la trentaine de critères que nous avons établis pour décrire les sites, seuls ceux qui nous semblent les plus nécessaires à l'internaute sont interrogeables directement à partir de la page d'accueil : langue de l'interface, référence à l'édition numérisée, intégralité ou non du texte… Il peut en outre personnaliser ses requêtes. En outre pour chaque site dédié à un auteur, sont indiqués les sites généralistes qui diffusent des textes de celui-ci. L'internaute peut alors comparer les différentes versions numériques existantes. [Exemple de Beaudelaire : http://lcp.damesme.cnrs.fr/ccrti/auteur-fiche.cfm?IDChercher=22]

    Enfin, l'internaute a toujours le choix entre la consultation d'une fiche synthétique et celle d'une fiche détaillée du site décrit.

    6 - Remarques pour conclure

    On peut dire en conclusion que ce catalogue électronique donne une image de la production éditoriale de qualité sur la Toile dans le domaine de la littérature française.

    De plus, il a non seulement pour ambition d'être utile à l'internaute pour le guider dans ses recherches, mais aussi d'inciter les responsables de sites littéraires à adopter une charte éditoriale minimale qui respecterait un certain nombre de règles, comme par ex. indiquer si les textes sont intégraux ou non, donner la référence à l'édition papier (quand celle-ci existe) ; les dates biographiques de l'auteur, la date de publication des ouvrages etc.

    Cette nouvelle technologie qu'est l'Internet permet aussi de donner aux textes une valeur ajoutée : notes, commentaires, liens hypertextes...Il faut encourager ce développement et ne pas se contenter de diffuser des textes bruts.


    A. Attali,
    (Laboratoire Communication et Politique CNRS UPR 36)
    Paris, 17 avril 2002


    Retour au programme