Équipe Réseaux, Savoirs & Territoires

ENS

logo AI

Actus | Articles et textes de référence | Cours et séminaires | L'équipe | Outils | Art, débats et expériences | Miroirs | Archives | Retour au serveur

Reptraqueur, le traqueur de répétitions / The Repetition Tracker

Par Éric Guichard, pour preuve de l'incidence de l'écriture (électronique) sur nos capacités intellectuelles.

Vous allez sélectionner un fichier (max 1 Mo) sur votre disque dur. Il vous sera retourné au format html, avec les répétitions trop proches en rouge.
Note (confidentialité): le fichier que vous envoyez sera détruit après traitement.

Paramètres

  1. Mon fichier est au format et mon ordinateur du type .
  2. Voici ma liste de séparateurs de mots (espace inclus): ' ; . ! , ? " : ( ) [ ] { } < > \ / = ` @ ^ | ~ * + # & $ _ % - .
    Si j'ai dit «Non», c'est parce que j'inscris ci-après ma propre liste de séparateurs, extraite de la précédente, qui me convient mieux:
  3. Je confondre minuscules et Majuscules et je veux repérer les mots qui se répètent à moins de autres mots les uns des autres;
    ceci dit, je juge inutile que les mots très fréquents (articles, prépositions...), apparaissant plus de soient coloriés.

  4. Les deux questions suivantes sont techniques et il est... déconseillé d'y répondre:
    Mon fichier a des sauts de ligne et son encodage est
    (si je choisis un encodage compliqué (type utf8), l'option Maj->min sera désactivée).

Let's go!

Maintenant, je sélectionne mon fichier dans mon disque dur: et je décide de .
Sinon, je me donne un temps de réflexion et décide de tout .


Bref exemple servant de documentation

Any sentence has words. But some words appear frequently, when other words are rare ou seldom. How can we, in any sentence, tag or trace the words which appear too frequently? An easy issue consists in counting the number of words between two repetitions. Suppose that you want to trace the repetitions within a distance of less than ten words? What will happen?
This:
Any sentence has words. But some words appear frequently, when other words are rare ou seldom. How can we, in any sentence, tag or trace the words which appear too frequently? An easy issue consists in counting the number of words between two repetitions. Suppose that you want to trace the repetitions within a distance of less than ten words? What will happen?

Remarques et commentaires

  • Je suis enseignant et chercheur, et j'écris donc des articles et des livres. Ayant de fortes tendances à me répéter, surtout quand les corrections d'un texte sollicitent des copier/coller, j'ai fabriqué ce programme pour mes besoins propres. Imaginant que je ne suis pas seul au monde à avoir de telles difficultés avec le vocabulaire, j'ai décidé de mettre en ligne cet outil.
  • Il est écrit en Perl, et utilise aussi les logiciels recode et antiword; il m'a obligé à comprendre 1001 choses sur les formats de fichier (incluant ces formes primitives de formats que sont les encodages). Et mon impression du moment, malgré ce que me disent les gourous de l'utf8, du web 2.0, auxquels je dois pouvoir ajouter ceux de l'IPV6, c'est que la normalisation de l'écriture électronique n'est pas pour... ce siècle.
  • Une telle production aide aussi à comprendre comment fonctionnent les logiciels d'écriture impérialistes (et donc autistes) et tayloriens (esclavagisants), qui inscrivent en un lieu caché l'encodage des fichiers. Les outils de traduction de tels dictatoriels, outils gratuits et libres, fabriqués à coup de rétro-ingénierie, nous donnent une idée des feuilletages réels et possibles de l'informatique, et nous libèrent au sens propre du terme, en proposant des traductions adaptées à l'encodage du système d'exploitation (et non pas du fichier. Cf. les locale).
  • Babel en ligne: avec l'internet, à l'impossibilité de communiquer s'ajoute désormais celle de trouver; malgré la prétendue qualité de nos moteurs de recherche, il faut bien des efforts pour repérer quelques informations pertinentes sur ces manières de coder (et non seulement d'encoder ou de formater) l'écriture.
  • Il n'en reste pas moins que si l'informatique a ses pendants étouffants, abêtissants, elle a, comme toute écriture, ses avantages. Et j'espère que Reptraqueur fera partie de la panoplie des catalyseurs de capacités (intellectuelles) qu'apporte toute technologie de l'intellect. Il devrait aussi donner le goût de la déclinaison: repérer les mots rares (travail déjà entamé à l'ENSSIB il y a 3 ans, cf. Hipix), les expressions stupides ou inutiles (il fo, yaka, fokon, évidemment, obligatoirement...) souvent d'autant plus fréquentes que notre pensée est en proie au doute, etc.
  • Ainsi les ordinateurs et l'internet permettent de fabriquer des outils qui n'existaient pas au 18e siècle. Ils contribuent aussi à développer la pratique de la preuve visuelle (ou graphique), réservée à quelques privilégiés il y a encore un siècle. Ce que fait modestement Reptraqueur en coloriant certains mots.
  • En conclusion: Enjoy!


Éric Guichard

Page créée en novembre 2008, modifiée le 10 juin 2009