par Émilie Devriendt
1. Production et diffusion de ressources "littéraires"
en ligne à l'École normale supérieure (Paris)
2. Usages de Translatio vus à travers ses access_log (octobre 2001-avril 2002)
Notes |
Annexe : Contenu des répertoires cités : Annexe : Ressources textuelles du site de Russon Wooldridge consacré aux dictionnaires anciens |
Malgré l'existence de plusieurs rapports consacrés aux pratiques
et à la diffusion des technologies d'information et de communication
dans l'enseignement supérieur, chez les étudiants, chercheurs
ou documentalistes [*] , on peut déplorer
l'absence d'études plus importantes consacrées à ces usages,
incluant notamment les activités de publication en ligne, de diffusion
de ressources ou de travaux universitaires. Si ces rapports insistent de fait
sur des usages de consultation plutôt que de production, c'est bel et
bien parce que ceux-ci apparaissent minoritaires par rapport à ceux-là.
Il m'a semblé utile dans cette perspective générale, de
proposer une contribution qui tâche de rendre compte conjointement de
ces deux aspects : celui de la publication à travers le site miroir Translatio,
et, à travers les statistiques d'accès à Translatio,
celui de la consultation de ce site. Ce dernier aspect sera ici encore le mieux
développé : nous avons une chance unique en effet, en tant que
gestionnaires ou créateurs de sites, d'avoir accès de manière
plus ou moins médiate, à notre lectorat. Une fois levés
un certain nombre de problèmes méthodologiques liés à
l'analyse des access_log, il nous est donné de voir, et peut-être
jusqu'à un certain point de comprendre --enfin !-- les intérêts
et pratiques de nos lecteurs. De comprendre, enfin, qui nous lit, fût-ce
dans l'anonymat --ô combien précieux-- des traces laissées
par des machines.
J'avais dans l'idée de proposer un panorama des ressources en ligne émanant des départements littéraires de l'ENS, destiné à mieux comprendre le contexte de publication de Translatio dans ce cadre institutionnel. Ce panorama sera nécessairement bref au vu de la relative pauvreté desdites ressources. Pauvreté sur laquelle il serait inutile de s'apesantir dans la perspective de ce colloque. Je parlerai donc des ressources existantes et non des éventuels projets institutionnels ou individuels de publication en ligne -- qui à ma connaissance sont peu nombreux [1] . Je parlerai donc essentiellement du site Translatio.
Les sites Web des départements littéraires de l'ENS constituent pour la plupart des plaquettes et comportent par là-même assez peu de pages. Cette conception de la publication en ligne peut être comparée à celle qu'illustrent aussi la plupart des sites universitaires. Leur relative pauvreté documentaire a déjà été soulignée par divers rapports consacrés aux usages des NTIC dans l'enseignement supérieur [2] .
Deux
sites "littéraires" diffusent des ressources électroniques
à proprement parler : Clio, site
consacré à l'histoire sociale, et Translatio,
miroir de trois sites consacrés à la langue et à la littérature
françaises. Tous deux font partie du serveur Barthes
de l'Informatique littéraire, reconvertie en équipe Réseaux,
Savoirs et Territoires. Clio bénéficie depuis un an
du soutien du Ministère de la Recherche. Il s'agit d'une revue complète
comprenant sources primaires et secondaires, comptes rendus d'ouvrages, de séminaires,
bases de données bibliographiques etc. Barthes même propose
quelques logiciels d'analyse textuelle et statistique, des ressources cartographiques
et des sources secondaires parmi lesquelles communications, index d'ouvrages,
résumés ou rapports d'études. Translatio sera évoqué
par la suite.
D'un point de vue institutionnel,
interne à l'ENS, la production et la diffusion de ressources documentaires
en ligne sont donc loin d'être développées, ni même
systématiquement encouragées.
Ce n'est pas à dire, pourtant, que les usages des technologies d'information
et de communication dans leur ensemble ne soient pas répandus chez les
littéraires de l'ENS. Il convient en effet d'insister sur ce point :
les usages réels des normaliens, enseignants-chercheurs et élèves,
demeurent difficiles à percevoir. Il n'est pas dit qu'ils se confondent
avec des pratiques institutionnelles. il n'est pas dit non plus qu'ils doivent
être mesurés en termes de production plutôt qu'en termes
de "consommation". L'équipement informatique mis à la
disposition des normaliens est du reste largement favorable au développement
des pratiques, pour le moins de consultation du Web. En outre, contrairement
à la réalité de bon nombre d'universités françaises,
les étudiants peuvent bénéficier d'enseignements techniques
de base, liés à la recherche documentaire (dans le cadre de la
bibliothèque) ou au maniement de logiciels, parfois plus avancés
(informatique littéraire, cartographie etc.).
Je ne reviendrai pas sur l'historique
du site, dont on pourra retrouver les principaux traits en ligne.
Créé en septembre 2001, Translatio est le miroir de trois
sites principaux consacrés à la langue et à la littérature
françaises : les deux sites torontois de Russon Wooldridge (Net
des Études françaises et son site
hébergé à l'Université de Toronto) et le site
clermonto-torontois de Jacques-Philippe Saint-Gérand (Langue
du XIXe siècle). Ces trois sites eux-mêmes sont le fruit
de collaborations éditoriales multiples dont la principale est certainement
assurée par Olivier Bogros et la Bibliothèque électronique
de Lisieux. On pourrait encore citer les liens qui unissent le NEF et
le site français Epistémon,
anciennement poitevin et aujourd'hui tourangeau, publié sous la responsabilité
de Marie-Luce Demonet.
Translatio ne fait donc que matérialiser (ou dématérialiser)
un réseau de collaborations : non pas sous la forme d'un cercle clos,
mais comme un espace de partage résolument ouvert.
Translatio en tant que miroir relève plus d'une politique de diffusion que de production à proprement parler, puisqu'hormis une page d'accueil proposant un index analytique des contenus mirorisés, la production des ressources s'est faite et se fait majoritairement de l'autre côté du miroir (de l'Atlantique ou du périphérique).
Les objectifs de cette mirorisation peuvent être rappelés, qui consistaient à :
Concernant les deux derniers points,
les attentes consistaient à toucher un public globalement universitaire,
mais aussi les acteurs de l'enseignement secondaire (NEF), et un public
majoritairement européen : les Canadiens n'avaient pas de raison de consulter
le miroir outre-Atlantique plus que l'original à Toronto. En revanche,
certains pays européens pourraient bénéficier de la proximité
du miroir, en termes de vitesse de connexion.
Un premier bilan peut aujourd'hui être tenté quant à la
réalisation de ces objectifs, grâce à une analyse des statistiques
d'accès au serveur. Ce sont les résultats de cette analyse que
je souhaiterais présenter. Ce faisant, certains usages de consultation
mériteront d'être soulignés.
Sans prétendre développer complètement ce point, il convient de rappeler certaines des précautions nécessaires à une bonne lecture des statistiques d'accès. Que l'on choisisse en effet d'avoir recours à un outil d'analyse, comme Webalizer ou d'autres, ou d'analyser directement les fichiers d'accès à l'aide de programmes ad hoc, il demeure impossible d'avoir une vision exhaustive et totalement transparente de ces données censées refléter "la" réalité des usages.
Quelques exemples suffiront à illustrer ce point :
2.1.2.1
Statistiques brutes (Webalizer)
Elles tiennent compte à la fois des moteurs de recherche, des fichiers
images, et ne prennent pas en compte le phénomène des caches.
Les données sont présentées dans le tableau 1 :
Mois
|
Sites | Nb-accès | Visites | Nb-fichiers consultés |
Octobre | 885 | 71117 | 1835 | 40769 |
Novembre | 1554 | 79966 | 2663 | 34450 |
Décembre | 2757 | 93409 | 4388 | 65582 |
Janvier | 4296 | 83876 | 6550 | 63752 |
Février | 3332 | 31185 | 4430 | 24637 |
Mars | 4360 | 41362 | 6635 | 35452 |
Avril | 5103 | 53790 | 7202 | 41728 |
TOTAL | 22287 | 454705 | 33703 | 306370 |
MOY/mois | 3184 | 64958 | 4815 | 43767 |
Pour information, les "visites"
correspondent à des plages horaires de 20 minutes par numéro IP.
Pour un même numéro IP, tous les accès compris dans ces
20 minutes font partie de la même visite. Si la machine se reconnecte
passé ce délai, cette connexion sera comptabilisée au titre
d'une nouvelle visite effectuée par elle. Les autres critères
ne posent pas de difficulté.
Les données du tableau 1 indiquent, telles quelles, une chute importante
du nombre d'accès à partir du mois de janvier. Les statistiques
raisonnées que nous présentons ci-dessous tendent à en
remettre en cause la pertinence des mesures intégrant les moteurs de
recherche (et les fichiers images).
2.1.2.2
Statistiques raisonnées
On a évacué les fichiers images ainsi que, dans la mesure du possible,
les accès dus aux moteurs de recherche. On obtient dès lors de
tout autres résultats, présentés dans le tableau 2. Pour
plus de commodité, on se limitera aux seuls accès par mois :
Mois
|
Nb-accès avec moteurs | Nb-accès sans moteurs
ni fichiers images |
Octobre | 71117 | 9421 |
Novembre | 79966 | 7473 |
Decembre | 93409 | 10526 |
Janvier | 83876 | 18882 |
Fevrier | 31185 | 12560 |
Mars | 41362 | 16725 |
Avril | 53790 | 17041 |
Totaux | 454705 | 92628 |
Sans grande surprise, le nombre d'accès
est presque cinq fois moins important lorqu'on élimine les moteurs de
recherche et les fichiers images.
Reste qu'ainsi, l'analyse peut se situer de manière plus assurée
du côté des utilisateurs réels, au lieu de noyer ces derniers
dans une masse d'accès mécaniques.
Si l'on considère plus attentivement
l'évolution des accès par mois, on verra qu'elle diffère
des statistiques brutes analysées par Webalizer. Le
biais engendré par la prise en compte des moteurs de recherche apparaît
très clairement. On s'aperçoit en effet que les accès augmentent
jusqu'en décembre dans un cas, alors que les statistiques épurées
indiquent une diminution en novembre : tendance inverse donc.
Inversement, la proportion d'accès bruts décroît à
partir de décembre, alors qu'elle augmente nettement du côté
des utilisateurs réels (le nombre d'accès passe grosso modo
de 10 000 à 20 000). Enfin, hormis la décrue du mois
de février (mois court et mois de vacances !), le nombre d'accès
hors moteurs et images affiche une tendance relativement stable, et même
en hausse.
Avec une moyenne minimale (n'oublions
pas les caches) de 13 233 accès "réels" par mois (soit
environ 450 par jour et 160 000 par an), Translatio est donc en bonne
place par rapport à la moyenne des sites d'érudition universitaire
français (à titre d'exemple, Clio, le "grand frère"
de Translatio, créé en 1997, compte deux fois moins d'accès
moteurs intégrés). En outre, l'augmentation du nombre d'accès
est de bon augure.
Enfin, il semble qu'on puisse d'ores et déjà caractériser
leur évolution au fil des mois en fonction des périodes académiques
françaises : décrue en novembre (vacances de la Toussaint), décrue
en février (vacances d'hiver). Seule la croissance du mois d'avril (vacances
de Pâques) fait exception à cette règle, bien que l'on puisse
toujours gager qu'elle aurait été encore plus forte en une période
sans congés ! J'aurai à revenir sur ces usages universitaires.
L'analyse des access_log nous permet de mettre à l'épreuve notre objectif de diffusion en Europe, en France notamment. Au-delà des difficultés méthodologiques de localisation évoquées précédemment, on peut analyser les données "explicites" de manière relativement fiable (toujours à partir des statistiques hors moteurs de recherche).
Le tableau 3 indique le nombre d'accès pour les 20 premiers "pays" connus :
20 premiers "pays" | Nb-ccès hors moteurs |
France | 45321 |
Autriche | 24673 |
.com | 9868 |
.net | 7437 |
Canada | 3387 |
Japon | 1988 |
Belgique | 1296 |
Suisse | 579 |
Espagne | 479 |
Italie | 303 |
Allemagne | 262 |
.org | 249 |
.edu | 238 |
Danemark | 176 |
Royaume-Uni | 147 |
Pays-Bas | 146 |
Brésil | 137 |
Russie | 124 |
Hongrie | 107 |
Portugal | 106 |
Le Canada apparaît en bonne place, ainsi que les .com ou .net, difficiles à localiser.
Cela étant, si l'on prend en compte la totalité des accès localisables (toujours hors moteurs) et non plus seulement les 20 premiers rangs, la proportion des pays européens s'élève à 59%, celle de l'Asie et de l'Amérique, à 5%.
On pourra visualiser la répartition des accès en Europe et dans le Bassin Méditerranéen sur la carte suivante : [4]
De manière intéressante,
les pays francophones sont bien représentés, mais n'ont pas l'exclusivité
des accès. Dans la mesure où le lectorat est censé compter
une majorité de spécialistes universitaires, ce fait n'est pas
pour nous étonner outre mesure. Le cas le plus frappant est néanmoins
celui de l'Autriche, à près de 25 000 accès en sept mois
(3572 par mois). L'analyse des machines autrichiennes connectées fait
apparaître l'importance d'un fournisseur d'accès local et donc,
d'une consultation à domicile.
Si l'on rapporte ces données au nombre d'habitants par pays, comme l'indiquent
les couleurs de la carte, ce phénomène apparaît encore plus
évident. La présence de la francophonie est plus marquée
encore. Enfin, un pays comme la Hongrie apparaît extrêmement représenté.
Pour conclure sur le bilan des localisations, on peut donc dire que l'objectif européen du miroir Translatio a été atteint. Bien plus, la localisation des accès européens fait apparaître une forme de "poussée vers l'Est" relativement inattendue, de la France vers la Hongrie. [5]
En matière de consultation universitaire, il m'a semblé intéressant d'aller voir ce qui se passait pour la France, dans la perspective qui est la mienne ici : à savoir celle d'un éclairage particulier sur les usages des TIC dans l'enseignement supérieur.
Les universités
françaises représentent
1511 accès àTranslatio. Par rapport au nombre d'accès
en France (45 321 hors moteurs), cela représente une proportion de 3,3%.
Ce qui peut sembler faible. Cela étant, ce constat doit, semble-t-il,
être nuancé par l'impressionnante proportion de consultations à
domicile (environ 76%), relevant de fournisseurs d'accès locaux (comme
on l'a déjà vu dans le cas de l'Autriche). On peut aisément
penser qu'un bon nombre d'étudiants, enseignants, chercheurs, documentalistes,
sont responsables de ces accès.
Le tableau 4 comprend les principaux fournisseurs d'accès français
(.net compris) :
Nb-accès | Fournisseur |
29779 | wanadoo.fr |
1072 | club-internet.fr |
1053 | noos.net |
778 | libertysurf.net |
443 | noos.fr |
318 | 9tel.net |
282 | tiscali.fr |
233 | free.fr |
209 | worldonline.fr |
171 | oleane.net |
120 | oleane.fr |
107 | easynet.fr |
84 | libertysurf.fr |
55 | freesurf.fr |
34704 | TOTAL |
Ces résultats nous amènent
à souligner une nouvelle fois le problème posé par les
caches de la plupart des fournisseurs d'accès : les fichiers étant
stockés dans une mémoire locale de leur serveur, c'est donc ce
serveur qui sera sollicité à chaque fois qu'une machine du réseau
local demandera les mêmes fichiers. Du côté de Translatio
donc, ce phénomène voudrait que toutes les statistiques soient
revues à la hausse, dans la mesure où nous ne pouvons avoir de
traces des consultations occultées par les caches, qui sont potentiellement
très nombreuses comme on l'a déjà suggéré.
Le cas de l'École
normale supérieure (Paris). Précisons une fois encore que
dans ces statistiques comme dans l'ensemble des décomptes "raisonnés"
précédents, les accès provenant du serveur barthes.ens.fr
n'ont pas été comptabilisés.
Or, malgré cette précaution méthodologique propre à
faire drastiquement baisser le nombre d'accès, l'ENS apparaît en
quinzième position dans le classement général des noms
de domaines ayant accédé à Translatio ; en cinquième
position parmi les noms de domaine spécifiquement français. Avec
997 accès, l'ENS représente à elle seule 2,2% des accès
français contre une proportion de 3,3% pour l'ensemble des universités
françaises.
On peut donc reprendre notre remarque précédente concernant la
distinction entre production en ligne et consultation : les statistiques d'accès
à Translatio l'illustrent de manière éloquente.
Alors que personne à l'ENS n'a jamais fait ouvertement preuve à
ses responsables (Éric Guichard et moi-même) d'un quelconque intérêt
pour ce site, tout concourt à prouver qu'ils ne le consultaient pas moins,
dans l'intimité de leur recherche.
Au sein de l'ENS, tout se passe donc,
finalement, comme si la publication de Translatio était un succès,
en cela qu'elle répondrait à un véritable besoin. Nous
sommes bien sûr heureux de le constater après bientôt huit
mois de silence institutionnel...
Pour essayer de donner un aperçu plus concret encore des usages de Translatio, on pourra analyser les statistiques d'accès en fonction du contenu des trois sites mirorisés. Non pas dans le but, pour leurs auteurs, de mieux cibler ou "accrocher" leur clientèle, selon l'usage traditionnel que les sites commerciaux font de telles analyses, mais avec pour visée, plus immatérielle, de mieux comprendre les pratiques de consultation et de documentation de leurs lecteurs.
Le tableau 5 indique le nombre total d'accès pour chacune des parties de Translatio (hors moteurs de recherche et fichiers images non pris en compte) :
Site
|
nb-accès | tx-accès |
Index Translatio | 4512 | 5% |
NEF | 11492 | 12% |
R. Wooldridge | 54948 | 59% |
Langue XIX | 21676 | 23% |
TOTAL | 92628 | 100% |
Ces proportions correspondent grosso modo à la "taille" respective de chaque site en nombre d'octets (fichiers images exclus), bien que quelques écarts doivent être soulignés.
Seul le site Langue du XIXe siècle présente une rigoureuse uniformité : 23% de Translatio, 23% d'accès à Translatio.
Plus instructive encore peut-être dans la perpective d'un étude du contenu : l'analyse des consultations par répertoire constitutif de chaque site. Dans les tableaux suivants, la proportion des accès est comparée à celle de la taille des répertoires (en nombre de fichiers, hors fichiers images, et toujours hors moteurs de recherche).
C'est la partie du miroir la plus difficile à analyser, en ce que l'architecture hypertextuelle complexe du site de Jacques-Philippe Saint-Gérand, envisagée sous la forme d'un fichier informatique de base, se présente comme un liste non hiérarchisée de répertoires (85 en tout), rendant tout regroupement délicat. On présentera donc ici tout d'abord les plus consultés de ces répertoires (sur 7 mois) (tableau 6), dont le contenu est détaillé en annexe :
Répertoires | nb-accès | tx-accès |
gdu | 2645 | 12% |
dg | 1779 | 8% |
hlfXIX | 1314 | 6% |
nodier | 1245 | 6% |
numlarou | 702 | 3% |
racine du site | 612 | 3% |
gramacor | 582 | 3% |
musique | 581 | 3% |
rhet | 537 | 2% |
chervel | 520 | 2% |
lexotor | 492 | 2% |
corinne | 475 | 2% |
igstyl | 450 | 2% |
rep_bib | 434 | 2% |
boiste | 385 | 2% |
littre | 372 | 2% |
urbana | 367 | 2% |
peignot | 350 | 2% |
... | ... | ... |
TOTAL | 21676 | 100% |
Je ne me risquerai pas à un commentaire qui reviendrait de droit à Jacques-Philippe Saint-Gérand, et me contenterai de quelques remarques : les dictionnaires sont à l'évidence bien placés (bien que l'on puisse a priori s'étonner de l'absence du Godefroy). Cela étant, au vu du nombre de répertoires à prendre en compte dans les statistiques, les taux d'accès s'avèrent rapidement insignifiants. J'ai donc pris le parti de proposer un indicateur qui puisse rendre compte des caractéristiques des consultations de manière plus adaptée : il prend en compte la taille des répertoires en nombre de fichiers. Je propose de l'appeler indicateur de pleine lecture (on verra pourquoi par la suite). Confronté au nombre d'accès, il donne un aperçu semble-t-il plus juste des répertoires les plus consultés (Tableau 7) :
Répertoires
consultés pleinement
|
|||||
Répertoire
|
nb-accès | tx-accès | tx-fichiers | nb-fichiers | IPL |
peignot | 350 | 2% | 0% | 1 | 9,04 |
gen_pals | 283 | 1% | 0% | 1 | 7,31 |
lacurne | 199 | 1% | 0% | 1 | 5,14 |
onomastique | 196 | 1% | 0% | 1 | 5,06 |
turgot_ety | 166 | 1% | 0% | 1 | 4,29 |
landais | 271 | 1% | 0% | 2 | 3,50 |
mercier | 123 | 1% | 0% | 1 | 3,18 |
lafaye | 122 | 1% | 0% | 1 | 3,15 |
godefroy | 236 | 1% | 0% | 2 | 3,05 |
firmin | 114 | 1% | 0% | 1 | 2,95 |
dalembert | 99 | 0% | 0% | 1 | 2,56 |
besch | 98 | 0% | 0% | 1 | 2,53 |
littre | 372 | 2% | 1% | 4 | 2,40 |
guerin | 91 | 0% | 0% | 1 | 2,35 |
dg | 1779 | 8% | 4% | 20 | 2,30 |
mesanger | 86 | 0% | 0% | 1 | 2,22 |
rhet | 537 | 2% | 1% | 7 | 1,98 |
Racine du site | 612 | 3% | 1% | 8 | 1,98 |
Répertoires
non consultés pleinement
(parmi les plus consultés en nombre brut d'accès). |
|||||
Répertoire
|
nb-accès | tx-accès | tx-fichiers | nb-fichiers | IPL |
urbana | 367 | 2% | 1% | 8 | 1,19 |
igstyl | 450 | 2% | 2% | 10 | 1,16 |
numlarou | 702 | 3% | 3% | 16 | 1,13 |
hlfXIX | 1314 | 6% | 7% | 38 | 0,89 |
nodier | 1245 | 6% | 7% | 37 | 0,87 |
chervel | 520 | 2% | 3% | 16 | 0,84 |
gramacor | 582 | 3% | 3% | 18 | 0,84 |
corinne | 475 | 2% | 3% | 16 | 0,77 |
boiste | 385 | 2% | 2% | 13 | 0,77 |
lexotor | 492 | 2% | 3% | 18 | 0,71 |
rep_bib | 434 | 2% | 3% | 16 | 0,70 |
gdu | 2645 | 12% | 22% | 123 | 0,56 |
musique | 581 | 3% | 6% | 31 | 0,48 |
Tableau 7. Répertoires très consultés et répertoires
moins consultés du site Langue du XIXe siècle.
Hormis le répertoire dg (qui correspond essentiellement au Traité de la formation de la langue inclus dans le Dictionnaire général ), les dictionnaires apparaissent relativement moins consultés. En revanche, notre indicateur de pleine lecture a permis de faire apparaître le Godefroy qui, bien que ne représentant que deux fichiers, est responsable d'un nombre d'accès relativement élevé.
De façon plus fine, on pourra proposer d'effectuer des regroupements de répertoires : ainsi, il paraît instructif de considérer les sources primaires et les sources secondaires :
Sources
|
nb-accès | tx-accès | tx-fichiers | fichiers | IPL |
total-primaires | 15232 | 70% | 76% | 424 | 0,92 |
total-articles | 6444 | 30% | 24% | 136 | 1,25 |
TOTAL Langue XIX | 21676 | 100% | 100% | 560 |
On remarque de fait peu de différences entre les deux types de sources distingués lorsqu'on tient compte de l'indicateur de pleine lecture. Les articles semblent un peu plus pleinement consultés que les sources primaires. De façon générale, on retrouve dans ces résultats l'équilibre remarqué précédemment à propos du site Langue du XIXe siècle (peu de différences entre la proportion des accès et la taille des répertoires).
2.2.2.2 Le site T. Russon Wooldridge
Ressources
consultées : essai de classement
Le tableau suivant indique les répertoires les plus consultés
du site de Russon Wooldridge consacré à la lexicographie :
Répertoires
|
nb-accès | tx-accès |
academie | 12647 | 23% |
articles | 8657 | 16% |
naf | 6462 | 12% |
edicta | 6133 | 11% |
rentexte | 6088 | 11% |
siehlda | 3131 | 6% |
vitruve | 2963 | 5% |
tiden | 2521 | 5% |
nicot | 2158 | 4% |
vegetaux | 1396 | 3% |
articles2 | 952 | 2% |
marine | 1193 | 2% |
rendicotexte | 100 | 0% |
interdico | 175 | 0% |
TOTAL-RW(hors index) | 54576 | 100% |
S'il n'est pas étonnant de constater le succès des bases dictionnairique et textuelles, on pourra remarquer l'importance de la consultation des articles consacrés aux dictionnaires. En cela, Translatio diffère de son "grand frère" Clio, où les sources secondaires apparaissent moins consultées que les sources primaires et les ressources bibliographiques. Néanmoins, ces résultats peuvent et doivent être pondérés (tableau 10) :
Répertoires
|
nb-accès | tx-accès | tx-fichiers | nb-fichiers | IPL |
interdico | 175 | 0% | 0% | 1 | 9,26 |
tiden | 2521 | 5% | 1% | 27 | 4,94 |
vegetaux | 1396 | 3% | 1% | 15 | 4,92 |
rendicotexte | 100 | 0% | 0% | 2 | 2,65 |
marine | 1193 | 2% | 1% | 29 | 2,18 |
rentexte | 6088 | 11% | 5% | 152 | 2,12 |
vitruve | 2963 | 5% | 3% | 100 | 1,57 |
articles | 8657 | 16% | 12% | 341 | 1,34 |
nicot | 2158 | 4% | 3% | 96 | 1,19 |
edicta | 6133 | 11% | 11% | 307 | 1,06 |
siehlda | 3131 | 6% | 7% | 199 | 0,83 |
articles2 | 952 | 2% | 2% | 61 | 0,83 |
academie | 12647 | 23% | 30% | 867 | 0,77 |
naf | 6462 | 12% | 24% | 691 | 0,49 |
TOTAL-RW(hors index) | 54576 | 100% | 100% | 2888 |
On ne sera pas surpris de constater que les bases dictionnairiques les plus importantes en nombre de fichiers ne sont que dans une certaine mesure consultées proportionnellement à cette taille (Dictionnaires de l'Académie, Base Nicot-Académie-Féraud). En outre, il semble que ce soit le propre des dictionnaires que de ne pas être lus in extenso. La notion de consultation prend donc ici tout son sens.
Ici encore, on pourra proposer de regrouper sources primaires et sources secondaires, tout en sachant que cette répartition a ses limites : chaque répertoire comprend la plupart du temps les deux types de sources (sauf à considérer les répertoires strictement consacrés aux articles ou aux monographies : articles/, articles2/, edicta/).
Ressources
|
nb-accès | tx-accès | tx-fichiers | nb-fichiers | IPL |
total-lexicologie | 2589 | 5% | 2% | 44 | 2,50 |
total-textes | 9101 | 16% | 8% | 253 | 2,00 |
total-secondaires | 19048 | 35% | 32% | 909 | 1,09 |
total-dictionnaires | 23838 | 44% | 58% | 1682 | 0,76 |
TOTAL | 54576 | 100% | 100% | 2888 |
Le constat concernant le mode de consultation partielle des dictionnaires est toujours de mise quand bien même, rappelons-le, les répertoires ici regroupés incluent systématiquement des études et commentaires métalexicographiques. Une étude encore plus fine, qui prendrait en compte les fichiers consultés et non plus seulement les répertoires, serait à même de préciser cette répartition. J'ai choisi d'effectuer ce type d'analyse concernant les seules ressources textuelles.
Textes
lus, recherches dans les textes
A travers l'analyse plus
détaillée des fichiers consultés, les textes ou les auteurs
"à succès" peuvent être repérés,
de même que peuvent être globalement estimées les pratiques
de lecture correspondantes. C'est ce dernier point qui nous importera ici.
Types de
ressources
|
||||||||||
nb-accès | tx-accès | nb-accès | tx-accès | nb-accès | tx-accès | nb-accès | tx-accès | nb-accès | tx-accès | |
Texte-lecture | 902 | 30% | 408 | 21% | 921 | 59% | 358 | 25% | 167 | 18,25% |
Interrogation TACT | 56 | 2% | 55 | 3% | 34 | 2% | 91 | 6% | 41 | 4,5% |
Apparat critique | 2005 | 68% | 1454 | 76% | 606 | 39% | 990 | 69% | 707 | 77,25% |
totaux | 2963 | 100% | 1917 | 100% | 1561 | 100% | 1439 | 100% | 915 | 100% |
On remarquera l'extrême importance de ce qui constitue l'apparat critique des textes consultables (listes alphabétiques, listes de fréquences, mais aussi études historiques, philologiques) ; bref, l'importance de l'aide à la consultation et des repères scientifiques. Pourtant, l'utilisation d'un outil d'interrogation comme les bases de données TACTweb apparaît étonnamment faible. Même si ces bases ne sont pas mirorisées, les traces des requêtes sont censées apparaître dans les access_log dans la mesure où le formulaire fait quant à lui partie des fichiers mirorisés. Tout se passe donc comme si les utilisateurs préféraient consulter des listes déjà faites (fussent-elles le résultat d'une interrogation sous TACTweb !) plutôt que d'avoir recours à l'interactivité du formulaire.
Une comparaison avec
les dictionnaires mériterait d'être systématiquement menée
et nous apprendrait probablement d'autres choses concernant les pratiques de
consultation des ressources en ligne. Cette étude déborde le cadre
de l'esquisse que j'ébauche aujourd'hui.
2.2.2.3 Net des études françaises
Reprenant le principe adopté pour les deux autres sites, je livre ici le tableau relatif au nombre d'accès en fonction des principaux répertoires du NEF : [6]
Répertoires | nb-accès | tx-accès |
nefbase | 3371 | 33% |
entretiens | 3322 | 32% |
acre | 1973 | 19% |
colloque | 980 | 10% |
portrait | 630 | 6% |
TOTAL | 10276 | 100% |
Répertoires | nb-accès | tx-accès | tx-fichiers | nb-fichiers | IPL |
acre | 1973 | 19% | 8% | 23 | 2,47 |
nefbase | 3371 | 33% | 15% | 45 | 2,16 |
colloque | 980 | 10% | 7% | 20 | 1,41 |
entretiens | 3322 | 32% | 42% | 125 | 0,77 |
portrait | 630 | 6% | 28% | 83 | 0,22 |
TOTAL | 10276 | 100% | 100% | 296 |
Tableau 14. Rubriques les plus consultées en fonction de l'indicateur de pleine lecture.
Je proposerai quelques remarques qui nous permettront de rapporter ces résultats aux précédents concernant les deux autres sites. Ils tendent à les rejoindre pour partie seulement :
Appendice : Auteurs et rubriques "à succès" dans la Nefbase (octobre 2001-avril 2002)
Le théâtre des XVIIe-XVIIIe
siècles est de loin l'objet du plus grand nombre d'interrogations (1791),
suivi de Maupassant (600), du corpus Epistémon (343) et de Daniel
d'Augé (363). Les autres bases mentionnées dans l'index, comme
Lexotor et le Grand Dictionnaire Universel de Larousse renvoient
à des URL extérieures au NEF.
Parmi les auteurs de la base Théâtre, le palmarès est le
suivant (en nombre d'accès décroissant) : Molière, Corneille,
Marivaux, Racine, Beaumarchais.
Pour Maupassant, ce sont les contes, suivis des romans qui font recette.
Utiliser l'indicateur de pleine lecture ici n'apparaît pas pertinent dans la mesure où le nombre de fichiers ne représente en rien la taille des différentes bases TACTweb. Ici, c'est bel et bien le nombre d'accès au formulaire de requête qui est fiable.
Ces coups d'oeil de l'autre côté du miroir auront été jetés tous azimuts, et peut-être de manière trop brève du goût des uns, trop appuyée selon les autres. Une telle présentation aura néanmoins permis, je l'espère, de cerner un peu mieux, ou de façon neuve, quelques-unes des pratiques de consultation des littéraires sur le Web.
Quant aux objectifs liés à la publication de Translatio, on a vu que les plus importants avaient été atteints, au bout de sept mois seulement de présence sur le Web :
Reste, pour conclure, à revenir sur le dernier objectif auquel devait répondre Translatio : celui de nourrir le site pour en faire un miroir à deux faces, en quelque sorte. Cet objectif, clairement, n'a pas été atteint.
Tout se passe comme si, décidément,
les usages "littéraires" des technologies d'information et
de communication se cantonnaient à des pratiques de consultation, entendue
de manière large, c'est à dire distinguée de la production
de ressources. Peut-être faut-il d'ailleurs, concernant les modalités
de cette consultation, mettre cette tendance en rapport avec quelques-unes des
observations qui précèdent : le lecteur préfèrerait
les apparats critiques aux sources elles-mêmes, priserait, enfin, la consultation
"passive" à l'interaction, lorsque le choix lui en est donné.
A moins que la consultation des apparats ne soit que l'effet d'un retour de
l'internaute sur le site, alors qu'une seule visite suffit généralement
pour télécharger l'intégralité d'un texte en mode
lecture.
Ces analyses peuvent être faites à partir des access_log.
Elles mériteraient de l'être, et pourraient apporter beaucoup à
la connaissance des pratiques de lecture des internautes, comme à l'étude
des contraintes liées au médium "réticulé".
Il est souhaitable que tout cela soit poursuivi à l'avenir, et débattu.
* On trouvera une liste de ces rapports sur le site du ministère de l'Éducation nationale : http://www.educnet.education.fr/documentation/etudes.htm. Voir notamment (6) Jean-Michel Salaün, Les usages et les besoins des documents numériques dans l'enseignement supérieur et la recherche - 1999, et (5) Étude des sites web des Universités - juin 2000. [Retour]
1. La bibliothèque des Lettres n'a pas encore achevé l'informatisation de ses catalogues, qui à elle seule mobilise entièrement les effectifs. Les seules ressources électroniques accessibles (outre le catalogue inachevé) sont les CD-ROM, consultables sur les postes en interne, comme dans toute bibliothèque universitaire. A ce jour, la numérisation des fonds anciens ou rares n'est pas prévue. La diffusion en ligne de travaux d'élèves ou d'anciens élèves non plus. Les Presses de l'ENS ne proposent pas de ressources sur leur site, à l'exception de leur catalogue. Pourtant, la diffusion de revues savantes est envisagée depuis peu et devrait commencer à se mettre en place en collaboration, notamment, avec l'équipe du site Clio (histoire sociale). [Retour]
2. Voir note [*] . Quelques initiatives méritent toutefois d'être soulignées :
Enfin, bien sûr, il arrive que des élèves ou d'anciens élèves littéraires participent à des revues électroniques. Ces activités sortent du cadre institutionnel ici considéré. [Retour]
3. Je tiens à remercier vivement Éric Guichard (Équipe Réseaux, Savoirs et Territoires, ENS) de m'avoir communiqué les access_log de Translatio dont il assure la responsabilité technique, et de m'avoir prodigué tous les conseils statistiques et cartographiques destinés à réduire, si faire se pouvait, ma faible compétence dans ces deux domaines. [Retour]
4. Cette carte a été réalisée grâce au logiciel Eratosthène, conçu et réalisé par Éric Guichard (ENS). [Retour]
5.
Ce point mériterait d'être précisé, en mettant l'accent
sur les problèmes de connexion liés à l'infrastructure
moins développée de certains pays européens, à l'Est
notamment. Le miroir, ici, joue aussi un rôle de diffusion "politique".
Pour plus de détails, on pourra consulter Éric Guichard, La
diffusion d'Internet dans les pays de la zone RIPE entre 1992 et 2000, http://barthes.ens.fr/atelier/cartes/
[Retour]
6. Certains répertoires propres à la vie du département des études françaises de l'Université de Toronto ont été soustraits aux calculs. [Retour]
Tableau 1. Statistiques
brutes par mois.
Tableau 2. Comparaison des statistiques brutes et des statistiques
épurées.
Tableau 3. Nombre d'accès (hors moteurs) pour les vingt
premiers "pays".
Tableau 4. Principaux fournisseurs français responsables
des accès de Translatio.
Tableau 5. Nombre d'accès pour les trois sites mirorisés.
Tableau 6. Répertoires les plus consultés du site
Langue du XIXe siècle.
Tableau 7. Répertoires très consultés et
répertoires moins consultés du site Langue du XIXe siècle.
Tableau 8. Sources primaires et sources secondaires dans Langue
du XIXe siècle.
Tableau 9. Accès aux différents répertoires
du site de Russon Wooldridge.
Tableau 10. Consultations des ressources du site de Russon
Wooldridge relativement à leur taille.
Tableau 11. Sources primaires et sources secondaires dans le
site de Russon Wooldridge consacré aux dictionnaires anciens.
Tableau 12. Quels besoins documentaires dans la consultation
de ressources textuelles ?
Tableau 13. Répertoires les plus consultés du
NEF.
Tableau 14. Rubriques les plus consultées en fonction
de l'indicateur de pleine lecture.
Carte des accès européens à Translatio.
Langue
du XIXe siècle
NB. Les dexcriptifs qui suivent sont issus de l'index du site de Jacques-Philippe
Saint-Gérand.
Site de Russon Wooldridge consacré aux dictionnaires anciens
Site
Net des études françaises
Ressources textuelles du site de Russon Wooldridge consacré aux dictionnaires anciens
E. Devriendt,
Paris, 24 mai 2002