Équipe Réseaux, Savoirs & Territoires

ENS

logo AI

Actus | Articles et textes de référence | Cours et séminaires | L'équipe | Outils | Art, débats et expériences | Miroirs | Archives | Retour au serveur

Atlas du premier tour de l'élection présidentielle française de 2002

Éric Guichard

Cet atlas en ligne propose de réaliser des cartes relatives au premier tour de l'élection présidentielle française (21 avril 2002).
L'espace de référence est la commune, et les résultats sont publiés dans un contexte régional ou départemental.

Accès direct à l'interface de production des cartes

Ce fichier décrit la méthodologie et l'usage du logiciel en ligne.
Un article, publié en 2007 dans la revue M@ppemonde, détaille les principaux résultats obtenus avec cet atlas:
http://mappemonde.mgm.fr/num13/articles/art07104.html

LICENCE: Cf. la rubrique licence, valable pour la totalité du site.

Sommaire

1  Le format SVG
2  Type et structure des données
    2.1  La carte
    2.2  Les variables
3  Travail sur les sources
    3.1  Données électorales
    3.2  Territoires proposés à l'étude
    3.3  Méthodes
        3.3.1  Méthode DU
        3.3.2  Méthode BFU
    3.4  Choix des bornes

1  Le format SVG

Le format Scalable Vector Graphics est un standard proposé par le W3C pour les graphiques du Web. Ses développement et usage sont en plein essor, et en 2009 la majorité des navigateurs savent l'interpréter. Parfois, il faut encore télécharger le plug-in SVG Viewer de la société Adobe (disponible à l'URL http://www.adobe.com/svg/), ou accepter son activation.
En cas de grosses difficultés, une documentation détaillée (datant de 2004, avec d'anciens liens locaux) permettant d' plug-in SVG Viewer est disponible au format html.

Dans le cas de l'atlas, le SVG permet, par diverses combinaisons de touches ou de boutons de la souris de déplacer l'image, de visualiser des objets a priori masqués, qui apparaissent lorsque la souris passe sur des zones spécifiées (ici, les noms des communes), voire d'effectuer des zooms (sans perte de qualité graphique).

2  Type et structure des données

Comme pour toute production cartographique, il y a deux catégories de données: un fond de carte et une ou plusieurs variables.

2.1  La carte

Un fond géographique principal, en fait, très géométrique: ici des polygones représentant des contours de communes, qui constituent notre sujet d'étude. D'autres fonds (on dit aussi «calques»), définissent des limites de départements et de régions. Le but est d'attribuer des couleurs aux communes pour décrire une variable qui leur est associée (cartes choroplèthes);

2.2  Les variables

Elles sont ici de trois types:

  1. noms des communes (Paris 20e, Mommenheim, Perpignan, etc.);
  2. nombre d'inscrits (ex.: 1352 pour Mommenheim). En première approximation, on peut admettre que le nombre d'inscrits vaut la moitié du nombre d'habitants (d'où, pour l'affichage des noms, le choix des seuils de 1000, 10 000 inscrits, qui renvoient grosso modo aux seuils de 2500 et 20 000 habitants, servant à distinguer villages, bourgs, et villes moyennes ou importantes). Cette variable, comme la précédente, est avant tout informative;
  3. pourcentage d'inscrits ayant fait un choix électoral;

    1. d'une part parmi les suivants: abstention, insertion d'un bulletin de vote (votants), bulletins valides (exprimés) ou non (blancs et nuls);
    2. d'autre part, au sein des exprimés, le pourcentage de personnes ayant voté pour tel ou tel candidat (ici Mmes et MM. Bayrou, Besancenot, Boutin, Chevènement, Chirac, Gluckstein, Hue, Jospin, Laguiller, Lepage, Madelin, Mamère, Megret, Le Pen, Saint-Josse, Taubira).

    On remarquera que ces deux classes de variables ne peuvent se comparer, puisque la somme des pourcentages de voix obtenus par les candidats vaut 100; autrement dit, les abstentions et blancs et nuls n'interviennent pas dans le décompte final. Il faudrait donc normaliser de façon différente les variables si l'on s'avisait par exemple d'additionner les absentions avec un vote prostestataire donné.

Le dernier type de variable (pourcentages) est ici celui que nous privilégions sur les plans statistique et cartographique; rappelons que l'unité spatiale de référence est toujours la commune; et si les projets les plus courants consistent à décrire la distribution de l'électorat d'un(e) candidat(e) dans un territoire donné (ce qui est déjà permis par cet atlas), l'on est souvent tenté de décrire des agrégations et des oppositions: vote de «gauche», par exemple, ou de «droite»; ou encore différence entre l'un et l'autre. De telles suggestions de panachages invitent à proposer 3 choix pour chaque candidat:

  1. il ou elle n'est pas pertinent(e) dans le contexte de l'étude que l'on se propose de réaliser. On ne tient alors pas compte du pourcentage de voix qu'il ou elle a obtenu;
  2. on en tient compte «positivement»: pour obtenir une description de son seul électorat, ou pour le combiner avec celui d'autres candidats;
  3. on en tient compte «négativement»: pour l'opposer, seul(e) ou avec d'autres, à un(e) ou plusieurs candidats dont les pourcentages de votants sont agrégés positivement.

Illustrons ces possibilités: si l'on choisit de représenter la différence de voix entre droite et gauche, par exemple dans le sens «droite - gauche», on pourrait compter positivement les taux de voix pour les candidats «Bayrou», «Chirac», «Lepage» (associés à l'option «+»), négativement ceux associés aux candidats «Hue», «Jospin», «Mamère» (option «-»), et ne pas sélectionner les autres candidats (option «Non»). Cet exemple, que nous espérons parlant pour le bon usage du programme, soulève néanmoins deux interrogations, qui sont partiellement à l'origine de la construction de cet atlas:

  1. pourquoi ne pas intégrer les pourcentages de voix en faveur de M. Chevèvement dans ceux de la gauche? Ou ceux de Mme Boutin dans ceux de la droite? Notre idée est simple: ce n'est pas au logiciel de trancher, mais à l'internaute. Cet atlas est un outil de description d'une réalité politique française à un instant donné, que l'on espère utile aux électeurs, aux partis politiques, aux universitaires, etc. C'est aussi un instrument d'aide à l'analyse: il sert à tester des hypothèses, il n'a pas à proposer des catégories. On verra que ses apports heuristiques tiennent principalement à la liberté de classement laissée à l'internaute;
  2. la seconde question renvoie à l'originalité de l'atlas: de très nombreuses cartes, classiques (gauche versus droite) ou moins connues (Verts versus CPNT), ont déjà été produites par de nombreux politistes et géographes. Il ne s'agit pas là de reprendre ou de reproduire ce qui a déjà été fait, mais de proposer des cartes inédites.
D'où l'intérêt de proposer toutes les options possibles, ce qui conduit à ces trois choix pour chacun des candidats.

3  Travail sur les sources

Nous n'évoquerons pas ici le fastidieux travail de sélection, nettoyage, homogénéisation, des sources primaires utilisées, que ce soit pour le fond cartographique (CD-Atlas de France du GIP-Reclus datant de 1991, donc incomplet) ou pour les données numériques (site web du ministère de l'Intérieur http://www.interieur.gouv.fr/avotreservice/elections/presid2002/), ni le lourd travail de vérification qui l'a suivi.

Le travail de structuration et d'organisation des données nécessaire au bon fonctionnement du programme final en ligne fut lui aussi complexe. Contentons-nous de rappeler qu'il correspond à une succession très ordonnée de programmes (de façon à reproduire avec un minimum d'intervention humaine la chaîne de production de données si jamais une des sources doit être modifiée), pour un total d'environ 7000 lignes écrites en Perl, les deux derniers éléments étant de type programme cartographique généraliste (le dernier programme, d'environ 1000 lignes, produit véritablement la carte). Si les données initiales se réduisaient à deux fichiers, d'un total de 10 Mo, les données finales sont très morcellées (environ 400 fichiers), ce qui accroît beaucoup leur taille: 100 Mo au total.

Nous précisons maintenant les effets de nos choix sur les représentations obtenues.

3.1  Données électorales

Les variables en pourcentage ont été arrondies, pour alléger la taille des fichiers et leur traitement. Il s'ensuit que certaines sommes de pourcentages peuvent parfois dépasser 100 % (49,5 + 49,6 + 0,9 deviennent 50 + 50 + 1). Ceci ne doit pas inquiéter les utilisateurs.

Certaines données manquent. Le plus souvent, c'est suite à des regroupements de communes (Lomme avec Lille, par exemple) postérieurs à l'établissement du fond de carte (qui fait référence à la situation de 1982). Mais il existe aussi des communes sans population (conservées à fins de mémoire nationale, comme certaines proches de Verdun), ou sans électeurs. Les données manquantes sont, dans tous les cas, signalées par des plages grises.

3.2  Territoires proposés à l'étude

  1. Les unités géographiques choisies sont le département et la région. La raison principale en est une volonté de produire les cartes rapidement, et d'en garantir aussi une transmission rapide. En effet, la plus légère des cartes «pèse» 150 Ko et la plus lourde 2 Mo. On comprend que dans ces conditions, une carte de la France entière (10 à 20Mo) aurait généré plus d'inconvénients que d'avantages, en temps de calcul comme en matière de débit; Et qu'elle aurait été peu lisible.
  2. Afin d'aider au repérage, les départements et régions choisis ont été placés dans un cadre qui rappelle leur voisinage, en tronquant si nécessaire les zones contiguës. Il s'ensuit que les zones frontières ont des cadres non clos, mais cela n'a aucune incidence sur les résultats. Par ailleurs, un souci de «calage» optimal de la carte dans la page du navigateur nous a invité à translater les coordonnées des objets de chaque zone étudiée. Il s'ensuit que l'on ne peut reconstituer une carte de la France entière en concaténant les fichiers des régions ou départements.

    Il eut été utile de disposer d'autres repères: fleuves et rivières, par exemple. Mais ceux-ci n'étaient pas disponibles au moment de la création de l'atlas.

  3. Cependant, pour faciliter ce repérage, deux options sont proposées aux internautes: le tracé du contour des communes, et l'affichage de leur nom. Le premier choix limite la perception des phénomènes territoriaux: aussi n'est-il pas proposé systématiquement. Le second choix double l'épaisseur du tracé du pourtour de la commune si ce dernier a été demandé, et sinon, en produit un, très fin, afin de ne pas gêner la lecture de la carte. Dans tous les cas, les communes dont le nom est demandé (ainsi que d'autres informations, à venir), sont donc signalées par leur bordure.
    Bien sûr, on peut demander l'affichage de tous les noms des communes. Mais ce choix alourdit considérablement la carte, et n'est pas nécessairement pertinent. En effet, on remarquera que les distributions électorales les plus extrêmes se situent souvent dans les villages, alors que les villes moyennes et grandes présentent une configuration plus normalisée. La localisation de ces dernières étant souvent connue, on a tout avantage à ne demander que les noms des petites communes.
  4. Cette cartographie est limitée à la France métropolitaine. Prochainement, les DOM et les TOM seront intégrés à l'atlas. Et si nous avons étendu l'atlas à la région Corse et à ses départements, ce n'est pas pour privilégier cette île au détriment, par exemple, de la Guadeloupe. Nous avons même tenu à rappeler, par souci de scientificité, la distance qui sépare la Corse du continent, contrairement à la majorité des atlas qui donnent à penser qu'elle serait à 50 ou 100 km de la Côte d'Azur. C'est pourquoi le Var et les Alpes-Maritimes n'apparaissent pas au voisinage de la Corse (et réciproquement).

3.3  Méthodes

Le programme Érathostène propose deux méthodes, DU (discrétisation uniforme) et BFU (bornes définies par l'utilisateur/trice). D'autres méthodes pourraient être développées: résidus de régressions, lissages, etc.

3.3.1  Méthode DU

Celle-ci revient à choisir un certain nombre de plages de couleurs pour la carte, et à partitionner les communes en autant de groupes, suivant les valeurs qui leur sont attribuées. Ces groupes ont donc tous la même taille (même nombre de communes). Par exemple, la variable «+ Hue - Chevènement» se distribue dans l'Aisne entre -15 % et +19 %. Il y a 809 communes dans ce département. Comme 809/5 vaut approximativement 162, les 162 premières définiront une classe (entre -15 et -3 %), les 162 suivantes une autre (entre -3 et -1 %)... jusqu'à la dernière classe (communes de rang supérieur à 648, entre +2 et +19 %). À chaque classe est associée une plage de couleurs. À noter que le choix des couleurs des plages n'est pas libre, afin de respecter la sémiologie graphique en usage: aux valeurs négatives sont associées des couleurs «froides» (du bleu foncé au bleu clair), aux valeurs positives des couleurs chaudes (du jaune clair au rouge foncé).

3.3.2  Méthode BFU

Cette méthode est surtout destinée aux personnes ayant réalisé une ou plusieurs cartes relevant d'un même thème et décidant de mettre en valeur un phénomène spécifique avec les seuils qui leur paraissent les plus pertinents, les plus aptes à offrir une lecture décisive de la carte qu'ils produisent. Elle est donc aussi particulièrement adaptée à la comparaison de cartes relatives à des zones géographiques différentes.

Le choix des seuils est libre à condition que ceux-ci soient ordonnés et limités à 5. Par exemple, une liste de valeurs du type -300 0 600 900 est acceptée même si elle n'a pas grand sens pour des (différences de) pourcentages (valeurs entre -100 et 100). De même, le fait d'insérer ou pas un espace entre le signe «-» et le nombre est sans incidence: -30 et - 30 sont interprétés de la même façon.

En revanche, le signe «+» n'est pas accepté: pour entrer la borne +20, saisissez simplement 20. De plus, les valeurs décimales (comme 5.2 et -4,5) sont rejetées, et vous êtes alors invité(e) à redéfinir vos paramètres (de toute façon, toutes les valeurs sont arrondies, cf. le point 3.1). Un même message vous est adressé si votre liste de valeurs n'est pas ordonnée (par exemple: 20, -30).

3.4  Choix des bornes

Dans tous les cas, le programme calcule et affiche lui-même les bornes exactes. L'exemple qui suit est tiré d'une situation rencontrée avec la méthode BFU, mais se généralise aisément à la première méthode.

Supposons choisis les seuils 5, 10, 15 pour une variable donnée, qui se distribue ainsi: 0, puis 6, puis 12 à 37. Alors les bornes proposées seront: [0,0] (ce qui est en dessous de 5), [6,6] (entre 5 et 9), [12,14] (entre 10 et 14), et [15,37] (au dessus de 15).

Accès à l'atlas

Page créée en décembre 2004, modifiée le 6 juillet 2009