L'atlas de l'immigration
Eric Guichard, Equipe Réseaux, Savoirs et Territoires, ENS
mars 2003
Motivations
La construction de latlas de limmigration en France entre les deux guerres correspondait à deux objectifs bien distincts.
Une accumulation de sources
Le premier consistait à faire quelque chose de toutes les données réunies sur les étrangers (ou considérés comme tels) en France entre les deux guerres. Certes, on avait démontré dans un ouvrage [1] que la majorité de ces données, provenant principalement des recensements généraux de la population [2], nétaient pas toujours convaincantes:
"[...] noublions pas que ces recensements, sils étaient exhaustifs, étaient, de lavis même des organisateurs, bien peu fiables: à cause des réflexes de défense de certains étrangers en situation précaire, qui navaient pas toujours envie dêtre dénombrés; suite aux résistances des maires, qui nappréciaient pas toujours lexcès de travail imposé par ladministration centrale; par le fait des agents recenseurs (trop facilement critiqués par les statisticiens de Paris), qui donnaient parfois à toute une famille la nationalité du père (même si la mère et les enfants étaient Français); enfin, du fait des services centraux, qui opéraient des rectifications au dernier moment, sans vérification sur le terrain[3]" .
Par ailleurs, les données étaient agrégées par départements, et on sait à quel point cette maille administrative est peu satisfaisante:"[...] nous savons bien que la présence des immigrés est souvent directement liée, au moins jusquen 1931, à lexistence de centres industriels. Et bien des départements fortement industrialisés ont aussi des composantes profondément rurales, où le taux détrangers peut être quasiment nul. Ainsi le département du Nord montre-t-il de forts contrastes, entre les arrondissements de Douai ou de Valenciennes, qui comprennent respectivement 16% et 13% détangers en 1936, et larrondissement de Dunkerque, qui ne dépasse pas les 3%. Le cas est encore plus significatif avec la Meurthe-et-Moselle, où larrondissement de Briey, avec 33% détrangers, soppose à celui de Lunéville (2%). Il en est de même avec Thionville-ouest (34% détangers) et Sarrebourg (1,5%) dans la Moselle. Cette caractéristique vaut aussi pour les départements essentiellement ruraux, qui ont un petit centre industriel (comme Alès dans le Gard), ou qui se sont lancés dans une politique de grands travaux (routes, chemin de fer etc.). De telles nuances ne peuvent apparaître dans nos cartes. Le département est donc une unité spatiale trop vaste pour être pleinement pertinente et lanalyse dune situation géographique à ce niveau doit toujours être complétée par une étude géographique et historique fine avant déviter les généralisations hâtives"[4] .
Ainsi, nous connaissions dès le début les limites scientifiques dune telle entreprise.
La concurrence
Une autre motivation est moins avouable. Peu satisfaits de larrogance dun ancien universitaire ayant monté une entreprise dédition de logiciels de cartographie, qui avait obtenu de solides subventions de lANVAR et prétendait offrir le meilleur outil de cartographie en ligne, nous décidions de faire mieux que les cartes de la répartition des médecins généralistes dans les régions françaises quil proposait sur son site. Certes, nous connaissions aussi les productions américaines (cartographie fine des recensements actuels, notamment), et nous savions que nous ne pouvions pas rivaliser avec de tels produits. Mais nous espérions prouver que des universitaires sans grands moyens pouvaient faire mieux que les champions français du géomarketing, à condition de construire des outils simples et fiables, et de répondre à de réelles préoccupations scientifiques.
Un environnement faste
La réalisation de latlas fut facilité par les trésors
de compétences découverts à lÉcole normale
supérieure (preuve, sil en faut, quun établissement
interdisciplinaire constitue encore aujourdhui le creuset idéal
de la recherche).
Aux historiens exigeants et méticuleux comme Philippe Rygiel et Anne-Sophie
Bruno, qui savaient non seulement trouver les données pertinentes
mais aussi acceptaient den faire une saisie informatique intelligente
et structurée, sajoutaient à lENS, haut lieu de
conception et de socialisation des logiciels libres, des informaticiens
érudits comme Jacques Beigbeder et Roberto Di Cosmo, qui apprenaient,
à qui le désirait, comment utiliser des outils gratuits et
robustes. Sans entrer dans les détails, rappelons que trois étapes
étaient nécessaires: transmettre une interrogation à
un serveur web (rudiments des cgi-bin), transformer une carte PostScript
en fonction des paramètres envoyés (ce qui revient à
manipuler des expressions régulières), et renvoyer une image
dans un format admissible par les navigateurs clients (gif ou jpeg). La
seconde étape nétait pas si simple, puisque nous avions
bien peu de compétence dans le PostScript complexe de logiciels comme
Illustrator, qui a servi à établir le fond de carte départemental
des années trente. Cependant, il suffisait dapprendre à
colorier en rouge un polygone, et à dessiner un cercle dun
diamètre donné. Pour cela, un outil comme Perl [5]
faisait admirablement laffaire. Le troisième point était
plus délicat: devions-nous apprendre le langage Java, comme nombre
de personnes nous y incitaient? Heureusement non. Parmi les mutiples outils
gratuits, lun dentre eux, GhostScript, permettait la conversion
dimages. Les informaticiens, après nous avoir patiemment enseigné
les rudiments de Perl et de la gestion des droits des machines Unix, nous
offrirent une formule magique, que nous avons plaisir à reproduire
ici:
/usr/local/bin/gs -sDEVICE=jpeg -sOutputFile=$k $j> /dev/null 2>&1
Cette simple ligne convertit un fichier PostScript (ici la variable $j)
en jpeg (le fichier $k), et montre en quoi les machines de type Unix (et
Linux) facilitent la réalisation de processus automatiques quand
les logiciels les plus connus obligent le chercheur à cliquer plusieurs
milliers de fois sur la même icône ou fenêtre de dialogue.
Il suffisait alors dassembler de multiples petites briques pour construire
un outil qui offrait 3888 cartes au lecteur.
Limites de l'outil
Elles dépendent du codage informatique, mais aussi de la distribution des données.
Programmation
Les cartes sont difficilement comparables entre elles
du fait des normes dautomatisation choisies: Par exemple, pour
les données absolues (population), les cercles représentant
les maxima ont tous le même rayon: 20 pixels. Et donc les 17126 Allemands
en 1936 dans la Moselle et les 701 Chiliens en 1931 à Paris seront
représentés par des cercles de même taille [6]
. Un problème analogue vaut pour les plages de couleurs, associées
aux pourcentages. Sur deux cartes distinctes, des départements de
la même couleur ne signalent pas pour autant des classes ayant les
mêmes limites: dans un découpage en quatre classes (recensement
de 1931), les départements où le taux de féminité
des Portugais est compris entre 19% et 33% apparaissent en orange. La même
plage de couleur vaut, dans le cas des personnes originaires des États-Unis,
pour des taux compris entre... 53% et 100%.
Nous savons maintenant régler ce type de problèmes [7]
. Mais, la possibilité de rendre des cartes comparables se retourne
aussi contre lutilisateur, qui doit sélectionner bien plus
de paramètres. Par ailleurs, nous avons plaisir à ne pas retoucher
latlas: dans sa facture actuelle, et grandement améliorable,
il témoigne à sa façon de ce que nous savions faire
il y a bientôt trois ans, même si cela est bien simple au regard
de ce que lon peut faire aujourdhui.
Le format dimage peut aussi poser problème: nous avons choisi
le jpeg, format libre, plus adapté à des images photographiques
quà une combinaison de texte et de plages de couleurs. En effet,
le format gif, plus approprié, était alors honni à
lENS, puisque son propriétaire, la société Unysis,
menaçait régulièrement les utilisateurs de ce format
de lui payer un copyright. Hier comme aujourdhui, il nous semblait
inadmissible doffrir de telles rentes à des entreprises qui
construisent des monopoles sur la base des techniques décriture.
Statut des données
Les données non significatives (présence
dune poignée détrangers dune catégorie
donnée dans un département) nont pas été
éliminées. Du coup, la présence de telles données,
et les effets pervers de la sémiologie graphique adoptée,
peuvent donner lillusion de distributions spatiales quil convient
de ne pas prendre pour argent comptant, si lon ne fait
pas retour - comme toujours-, aux données de base, heureusement
disponibles [8].
On espère cependant que cet atlas a quelque utilité, pour
le pédagogue comme pour le chercheur.
La consultation de latlas est faible: un an
après son lancement, il ny avait quune trentaine de connexions
par jour sur son site. Aujourdhui, ce nombre est multiplié
par quatre, ce qui témoigne dun succès destime,
mais sans plus. Des statistiques plus élaborées montrent que
parmi la centaine de lecteurs, un cinquième demande effectivement
à visualiser une carte.
Il est toujours difficile de procéder à lanalyse de
la réception dun outil sur le web. Faut-il privilégier
les publications plaisant au grand public ou celles qui satisfont un petit
nombre dexperts? Par ailleurs, lensemble de nos collègues
disposent-ils de loutillage intellectuel nécessaire à
une utilisation raisonnée des objets de linternet? Diverses
expériences douloureuses nous donnent à penser que non. Nous
avons eu la preuve que rien ne vaut une démonstration des potentialités
de latlas devant des chercheurs motivés. Cependant, un récent
passage au Festival International de géographie de Saint-Dié-des-Vosges
nous a permis de constater que des enseignants dhistoire et de géographie
des lycées et des classes préparatoires utilisent régulièrement
cet atlas, comme lensemble des productions historiques et cartographiques
du site http://barthes.ens.fr. Ce qui est dautant plus réconfortant
que au-delà de latlas de limmigration -
nous avons la preuve que les cartes publiées sur le web sont rarement
consultées: même dans les situations les plus confortables,
quand la facilité de visualisation se conjugue avec un thème
grand public comme celui de la fracture numérique, et quand nous
produisons des animations - en partie pour souscrire aux injonctions
publicitaires -, le résultat ne dépasse pas celui enregistré
par latlas [9]. On découvre
alors la position incertaine de la cartographie, qui apparaît encore
comme un outil dingénieurs, lesquels en perçoivent vite
lintérêt mais ne sont pas toujours familiarisés
avec les problématiques des sciences humaines quelle peut illustrer,
à lopposé, en tant que dispositif décriture,
ses apports heuristiques sont encore mal perçus par les historiens,
sociologues et anthropologues.
Mais peut-être sommes-nous trop exigeants, car habitués à
des statistiques de consultation qui ont, pour lensemble du
site , vite dépassé les 1000 accès par jour, et
qui se montent en octobre 2001 à 5000 accès jour. Malgré
tout, ce sont au total 1008 cartes distinctes qui ont été
réalisées, sur un total de presque 4000, dont beaucoup sont
redondantes, ou appliquées à des groupes détrangers
peu significatifs (comme les Océaniens, les Autres
Asiatiques, etc.). Et nous nous consolerons en rappelant que latlas
a été consulté près de 50000 fois depuis sa
fondation.
Ceci dit, il nous semble important de pousser lécriture sur
le web à ses limites, tout en continuant à développer
notre politique de publication de sources primaires: la richesse dun
site web universitaire tient plus à la spécificité
des données publiées et à la réflexion sur les
potentialités de loutil, par exemple en termes de production
de produits dérivés de ces sources et de leur
appropriation par le lecteur, quen le désir de réaliser
une pâle copie de ce qui existe déjà.
Le support numérique facilite grandement la manipulation des mots,
listes, et tableaux de données qui constituent lunivers du
chercheur. De fait, la production de sens sappuie plus quon
ne limagine sur un travail combinatoire sur les objets pré-syntaxiques
(ou morpho-syntaxiques) que sont les graphies des mots et leurs balises.
La recherche dune expression, les facilités dordonnancement
offertes par les méthodes automatisées transforment en profondeur
nos manières de travailler: lindex est inutile
[10], les catégorisations, simples ou sophistiquées,
se réalisent rapidement.
Ainsi, lorganisation du raisonnement est grandement facilitée
par la manipulation doutils de tris, de comptages, de productions
graphiques. Le mot perd de sa noblesse (une phrase, un nombre, ne sont que
des données) mais la démocratisation de son statut nous fait
gagner en efficacité. Autrement dit, la production intellectuelle,
la psyché, ne peuvent faire léconomie des outils externes
simplissimes qui sont aujourdhui à notre disposition. La corrélation
entre texte et image, déjà apparue avec les tableurs, devient
manifeste avec la production de cartes. Et même lanalyse statistique
dun corpus purement littéraire peut aussi donner
lieu à des représentations graphiques pertinentes, décrivant
de façon synthétique des distributions doccurrences,
voire de concepts.
A partir de là, trois chantiers sont ouverts.
Socialiser les outils de base du chercheur
Ceci signifie tout dabord mettre à
la disposition de qui le désire lensemble des documents qui
font le quotidien du travail scientifique: archives numérisées,
bibliographie, notes de lectures, etc. A cette première matière
sajoutent les méthodes, statistiques, cartographiques, lexicométriques.
Autant doutils robustes, dont il convient de rappeler quils
ne sont pas toujours nécessaires, mais qui ne doivent pas pour autant
être systématiquement rejetés. Ces derniers sont aisés
à mettre en place, sur un site web, par exemple. Ils peuvent sappliquer
à un corpus résidant sur le serveur, comme dans le cas de
latlas, ou sadapter aux données du lecteur
[11].
Plutôt que dacheter un logiciel complexe, qui ne fonctionnera
que sur un type donné de système dexploitation, le chercheur
accède alors à une somme doutils simples et gratuits.
A lui de choisir le plus pertinent.
Cette socialisation peut sétendre à des modes décriture
encore peu expérimentés: on peut aujourdhui réaliser
des cartes animées, fort utiles pour la compréhension de phénomènes
historiques (évolution dune situation au fil du temps), ou
plus largement quantitatifs Voir
pour se faire une idée de la forte influence du monde rural sur la
vie politique française contemporaine).
Mais elle se conjugue aussi avec un accroissement de lautonomie intellectuelle:
plutôt que de présenter un produit fini, mais rarement
exhaustif, pourquoi ne pas laisser le lecteur libre de lexpérimenter,
de le compléter en fonction de ses problématiques personnelles?
Cest dans cet esprit quavait été conçu
latlas.
Expliciter les méthodes collectives
Laccès à de telles sources
et outils donne une dimension de laboratoire au serveur web: un laboratoire
est un lieu de rencontre entre chercheurs qui savent disposer là
des outils propres à leur travail (bibliothèque, ordinateurs,
cafétéria, etc.). A partir de là, nous pouvons légitimement
espérer reproduire avec les outils informatiques les méthodes
de travail collectif éprouvées par le temps: hélas,
lexpérience prouve que les spécialistes et les érudits
utilisent surtout les logiciels grand-public; or ces produits étouffent
plus lindividu quils naident au déploiement de
sa pensée. Et sauf à se plier au monopole des traitement de
texte dominants du marché - et donc dacheter tous les
six mois lultime version dont la réclame pollue notre paysage -,
ces logiciels empêchent toute forme de travail à plusieurs.
Ny-a-t-il pas moyen déchanger de façon simple
des textes, de les retravailler collectivement, de les soumettre à
des confrères et de les publier? Déjà le web et son
codage associé, lhtml, apparaissent comme une solution efficace.
Et si les outils dannotation et de travail critique intégralement
sur le web ne sont pas encore aboutis, à nous de les concevoir. Non
pas en nous plongeant dans les arcanes de la programmation (bien que celle-ci
est parfois si simple et si productive quelle devrait être enseignée
dans les collèges), mais en explicitant les modalités du travail
collectif au sein dun groupe de chercheurs. De telles explicitations
sont tellement attendues par les industriels quon rencontre aujourdhui
une situation imprévue: il est aisé de faire financer des
recherches théoriques en sciences humaines par des entreprises et
par des ingénieurs. Comme disent ces derniers, on sait tout
faire en informatique. Il ne nous manque que les idées, pour inscrire
la production dans une logique dusages. Les chercheurs en sciences
humaines doivent donc admettre que leur capacité à expliciter
leur activité intellectuelle sera le moteur essentiel de lindustrie
dans les prochaines années.
Epistémologie et sociologie des disciplines
De telles approches sont doublement fécondes. Tout dabord, la publication sur le web et la construction de nouveaux outils décriture et de lecture incitent à repenser le rapport à limprimé. Latlas de limmigration naurait jamais été accepté par un éditeur, du fait de sa trop grande taille, et de son trop maigre public. Et, même dans le cas dun ouvrage de taille réduite - et nécessairement subventionné -, le lecteur naurait jamais pu profiter de lautonomie qui lui est donnée, ni de laccès direct aux tableaux statistiques à lorigine des cartes (dans le meilleur des cas, il devrait recopier ces listes de nombres).
Les formes éditoriales du web incitent donc
le chercheur à questionner les logiques économiques de la
publication imprimée, tant sans langle du rapport au marché
et de la rentabilité, que sous celui de la relation ambiguë
que les universitaires entretiennent avec les éditeurs, et entre
eux, par le biais de ces derniers. Autrement dit, lexpérimentation
de lécriture sur le web permet dexpliciter le régime
de léconomie symbolique[12]
propre au monde universitaire et ses liens avec la production imprimée
(revues savantes, manuels scolaires, etc.).
Mais, au-delà de lanalyse sociologique du monde de la recherche,
indispensable pour continuer davoir foi en la recherche scientifique
et pour oublier les tristes conflits universitaires, lusage des outils
décriture contemporains incite à sinterroger sur
les méthodes de la discipline: lesquelles sont plus le fruit dune
tradition besogneuse, dune routinisation de la recherche, plus que
dune réelle avancée méthodologique? Comment penser
une numérisation des archives des historiens qui ne vire pas à
lusine à gaz? Pourquoi les outils efficaces construits par
des universitaires pour des universitaires sont-ils méconnus au profit
de logiciels coûteux et inefficaces? Comment, en cette période
de vif intérêt des étudiants pour lhistoire récente
et contemporaine, lhistorien intègre-t-il les outils décriture
actuels dans ce qui constituera dans 20 ans son patrimoine intellectuel?
Nous considérons que les outils décriture actuels ne
sont que des traces, cest-à-dire le matériau premier
de lhistorien, et plus généralement de tout chercheur.
Un changement de nature de ces traces - outre la question de leur rapide
disparition, sinon du lourd appareillage technique dont devra disposer lhistorien
de demain pour réussir à lire des documents électroniques
des années 1980 - renvoie assurément à un questionnement
sur la notion darchive, et favorise une réflexion sur lépistémologie
de la discipline.
Notes
[1] Eric Guichard, Gérard Noiriel (dir.), Construction des nationalités et immigration dans la France contemporaine, Paris, Presses de lENS, 1997.[Retour au texte]
[2] Statistique générale de la France, Résultats statistiques du recensement général de la population effectué le 8 mars 1931, Tome I - Cinquième partie, Étrangers et naturalisés, Paris, Imprimerie nationale, 1936. Service national des statistiques, Direction de la statistique générale, Résultats statistiques du recensement général de la population, effectué le 8 mars 1936, Tome I - Cinquième partie, Étrangers et naturalisés, Paris, Imprimerie nationale, 1943.[Retour au texte]
[3] Eric Guichard, Gérard Noiriel , "Construction des nationalités et immigration dans la France contemporaine" présentation de l'ouvrage", Site Clio, [Retour au texte]
[5] En fait un langage de programmation conçu par Larry Wall pour gérer un réseau dordinateurs, vite détourné par les passionnés danalyse textuelle.[Retour au texte]
[6]Eric Guichard, "Présentation de l'atlasclio", Site Clio. [Retour au texte]
[7] Eric Guichard, Atelier cartographie. [Retour au texte]
[8] Une lecture rapide donnerait à penser quen 1936, les Norvégiennes sont installées en masse en Corse, alors que leurs compatriotes du sexe masculin sinstallent, eux, dans le Var: il y a trois Norvégiens, dont deux femmes en Corse, et un, de sexe masculin, dans le Var.[Retour au texte]
[9] Par exemple, les pages ne sont pas consultées plus de 20 fois par jour.[Retour au texte]
[10] Tout comme la rigueur de la rédaction bibliographique: à quoi bon se forcer à mettre le nom de léditeur avant ou après le nom de la ville ou lannée dédition, puisquon peut interroger une base bibliographique suivant les entrées de son choix? [Retour au texte]
[11 ]Voir (http://barthes.ens.fr/KT) pour la constitution dun dictionnaire, et http://queneau.ens.fr/CAH/distances.html pour la production de classifications ascendantes hiérarchiques. [Retour au texte]
[12] Pierre Bourdieu, Homo Academicus, Paris, Les éditions de Minuit, 1984.[Retour au texte]