Site professionnel d'Éric Guichard

Site historique de l'équipe Réseaux, Savoirs & Territoires (Ens-Ulm)

logo AI

Actus | Articles et textes de référence | Cours et séminaires | L'équipe | Le RAIL | Outils | Art, débats et expériences | Diapos | Archives

Création du dictionnaire de votre fichier / Create the dictionary of your file

Mode d'emploi / Howto

Sélectionnez un fichier au format texte résidant sur votre disque dur.
Select a text file (ASCII, mac or ISO-8859-1) of your hard disk.

Le dictionnaire sera alors affiché, avec en regard de chaque mot, sa fréquence d'apparition. Vous avez jusqu'à 12 choix de tri.
Its dictionary will be produced, with the frequency of each word. You have 12 different ways to sort your result.

Ensuiste sont produits deux graphes rang-fréquence de la distribution de ces mots (au format SVG): l'un, normal, l'autre avec des échelles logarithmiques. C'est très utile pour comprendre la loi de Zipf.
You will see the plot of the rank-frequency distribution of the words (SVG format), which is useful to understand the Zipf law.

Notes: Si votre fichier est conséquent, les temps d'affichage risquent d'être longs. If your file is heavy, your browser may be slow to produce the results.


Usage / Use

Pour un usage standard, vous n'avez qu'à sélectionner le point 1.
For a common use, just choose your file (question 1) and forget the other options.

1. Choisissez votre fichier texte / Select your text file:

2. Choix des séparateurs de mots / Selection of the words separators
Voici la liste prédéfinie des séparateurs de mots (espace inclus) / Here is the list of standard separators:
' ; . ! , ? ¿ " : « » ( ) [ ] { } < > \ / = ` ´ ^ | ~ * + ÷ # & $ £ %
Oubliez ce point si cette liste vous convient. Sinon, choisissez l'option Mes sép(arateurs) et inscrivez dans le champ vierge qui suit la liste de vos séparateurs (avec un espace entre chacun). If this list is ok, forget this option. Otherwise, select the My sep(arators) option and fill the next field with your own separators (with a whitespace between each).

3. Désirez-vous une confusion minuscules/Majuscules? Do you want to lower-case all letters?

4. Tri des mots / Words sort
En gras: méthodes les plus courantes. In bold: current methods

French EnglishButton
alphabétique ordinateur computer alphabetical
alphabétique Ouest Europe (OE) Western Europe (WEu) alphabetical
alph. OE inverse (Scrabble) reverse WEu alpha
fréquences croissantes, puis ASCII increasing frequencies, then ASCII
fréqu. croiss., puis alpha OE increasing freq., then WEu
fréquences décr., puis ASCII decreasing freq., then ASCII
fréquences décr., puis alpha OE (Zipf) decr. freq., then WEu
fréqu. crois., puis alpha OE inverse incr. freq., then reverse WEu
fréqu. décr., puis alpha OE inverse decr. freq., then reverse WEu
fréqu. crois., longueurs, alpha OE incr. freq., lengths, WEu
fréqu. décr., longueurs, alpha OE decr. freq., lengths, WEu
long. crois., fréqu. décr., alpha OE (Mandelbrot) incr. lengths, decr. freq., WEu

4. Sélectionnez votre système d'exploitation (ou encodage) / Your Operating System

Éric Guichard

Page créée en 2001, modifiée le 10 juin 2009