NEF - Le Livre 010101 de Marie Lebert - Articles

Projet Gutenberg: quelques réponses à vos questions

paru dans Edition-actu n° 91, 1er mars 2004

Suite à mon article du 15 février sur Michael Hart et le Projet Gutenberg, qui parlait entre autres de la création prochaine du Projet Gutenberg Europe (Michael Hart vient d’intervenir à ce sujet au Parlement européen), j’ai reçu pas mal de courrier, auquel je réponds ici.

Rappelons, si besoin est, que le Projet Gutenberg est moins américain qu’international. Si la maison-mère est aux Etats-Unis, le Project Gutenberg Australia et le Projekt Gutenberg-DE (Allemagne) ont débuté il y a fort longtemps déjà. En cours de création, le Projet Gutenberg Europe est européen, avec une équipe active basée à Belgrade. Et ainsi de suite. Avec des passerelles entre les différents projets. Pour ma part, je trouve intéressante l’idée de constituer une bibliothèque numérique francophone en partenariat avec d’autres communautés linguistiques, ce qui prépare l’avenir, quand la traduction automatique deviendra satisfaisante à 99% (de ce côté-là, les choses avancent bien aussi, même s’il reste beaucoup à faire). D’ici une dizaine d’années, tout lecteur pourra demander tel ou tel classique dans la langue de son choix (sont prévues 100 langues différentes). Unissons donc nos forces au lieu de travailler chacun de notre côté, pour une fois que c’est possible.

Rappelons aussi que toutes les personnes travaillant au Projet Gutenberg sont bénévoles, y compris Michael Hart, le fondateur du projet. Le but étant d’assurer la pérennité du projet indépendamment des crédits, des coupures de crédits et des priorités politiques et culturelles du moment. Pas de pression possible donc par le pouvoir et par l’argent. Et respect à l’égard des volontaires, qui sont sûrs et certains que leur travail sera utilisé pendant de nombreuses années, si ce n’est pour plusieurs générations. Les donations servent exclusivement à l’achat de matériel, principalement des ordinateurs et des scanners.

Rappelons enfin que tous les livres scannés sont relus et corrigés à deux reprises, par deux personnes différentes, pour atteindre un taux de fiabilité de 99,9%. Un logiciel présent sur le site (encore en phase de test) permet de convertir les livres encodés en ASCII, ISO-8859, Unicode, Big-5, etc. en d'autres systèmes de codage. La conversion sera possible aussi plus tard dans bien d'autres formats, y compris en braille et en audio. Il est donc inutile d’entamer un débat stérile sur les avantages ou non du format texte par rapport aux autres. Le format texte peut soit être utilisé comme tel, soit permettre de générer d’autres formats. De plus, les livres au format texte peuvent être utilisés à volonté par des organismes souhaitant les proposer dans des formats plus sophistiqués, sans restriction d’aucune sorte, si ce n’est le respect du droit d’auteur en vigueur dans le pays de résidence, et la gratuité des nouvelles versions produites.

Répondons maintenant aux questions sur la méthode utilisée par les volontaires qui sont correcteurs. Vous allez sur le site de Distributed Proofreaders Europe, qui vient d’être mis en ligne (encore en phase de test) par le Projet Rastko (Belgrade) pour gérer l’essentiel de la relecture partagée du Projet Gutenberg Europe. Vous choisissez la page d’accueil en français si celle-ci n’apparaît pas par défaut. Vous commencez par vous inscrire. Vous recevez ensuite des directives détaillées (traduction en cours). Par exemple, les parties en gras, en italique et soulignées, tout comme les notes, sont traitées de la même façon d’un livre à l’autre, pour permettre une harmonie entre tous les ebooks produits. Un forum de discussion vous permet en permanence de poser vos questions et demander de l’aide si nécessaire. A chaque fois que vous vous connectez au site, vous sélectionnez le livre de votre choix. Sur le web, la page du livre que vous avez choisi apparaît simultanément en deux versions se faisant face: d’une part l’image scannée d’une page, d’autre part le texte issu de cette image, produit par un logiciel OCR (optical character recognition). Vous comparez les deux versions et vous corrigez les différences, la numérisation par OCR étant en général fiable à 99% (ce qui représente en moyenne dix erreurs à corriger par page). Vous sauvegardez ensuite la page, et vous pouvez soit cesser le travail, soit demander une autre page. Tous les livres sont relus et corrigés deux fois de suite (et, pour la deuxième fois, uniquement par des correcteurs expérimentés) avant d’être mis en forme et intégrés dans les collections (ensuite, les fautes signalées par les lecteurs sont systématiquement corrigées). Vous n’avez aucun quota à respecter. A titre purement indicatif, il est suggéré de relire une page par jour, si possible. Cela semble peu, mais une page multipliée par des centaines de volontaires représente un chiffre considérable. En 2003, sur le site original de Distributed Proofreaders, une moyenne de 250 à 300 correcteurs travaillant quotidiennement a permis de produire entre 2.500 et 3.000 pages par jour, ce qui représente deux pages par minute.

Les volontaires qui le souhaitent peuvent également travailler de manière indépendante, à savoir saisir eux-mêmes un livre sur le traitement de texte de leur choix, de la première ligne à la dernière, ou scanner un livre eux-mêmes, le convertir en texte par le biais d’un logiciel OCR et faire les corrections nécessaires en comparant le résultat à l’original. Dans les deux cas, une deuxième relecture est effectuée par une tierce personne.


Liste des articles
Page d'accueil du Livre 010101
Page d'accueil du NEF


© 2004 Marie Lebert