Un premier regard sur les outils de création de documents web

Russon Wooldridge

University of Toronto

Novembre 2000
© 2000 Russon Wooldridge

Soit le texte

R. Di Cosmo & D. Nora, Le Hold-up planétaire

La révolte des serfs

[...] Microsoft Word autorise maintenant à sauvegarder ses fichiers en HTML, le langage du Web. D'un simple geste, vous pouvez donc envoyer à vos collègues des fichiers en HTML que tout le monde pourra lire, et non pas en klingonien version x.y, qui exige que votre interlocuteur ait, lui aussi, choisi de payer la taxe Microsoft.

De même, la France, la Communauté européenne, et les entités publiques en général, sont censées fournir toute information publique dans un format accessible à tous. Pourquoi faudrait-il acheter tel ou tel logiciel propriétaire pour pouvoir lire un texte de loi ou un appel d'offres? Encore une fois, de tels formats existent, présentent l'information correctement, et sont accessibles même à qui travaille en Word. Pourtant, malgré maintes lettres de protestations de la part d'innombrables scientifiques (dont votre serviteur), on trouve fréquemment sur des sites officiels de l'Union Européenne - comme http://www.cordis.lu - des documents lisibles seulement par la version la plus récente de Microsoft Word. Contre toute logique, et contre l'intérêt de tous.

C'est sans doute l'aspect à la fois le plus méconnu et le plus important de toute la question, parce que c'est précisément à travers le détournement de standards ouverts et l'introduction de standards propriétaires que Microsoft cherche à substituer ses propres produits aux innombrables applications libres et souvent gratuites, qui constituent le coeur de l'Internet.

(Roberto Di Cosmo & Dominique Nora, Le Hold-up planétaire: la face cachée de Microsoft, Calmann-Lévy, 1998, p. 142-3.)

Cet extrait tapé et encodé de façon minimaliste dans un éditeur html occupe 1762 octets (Figure 1); tapé et converti en html sous Word 97, il fait 2309 octets (Figure 2); tapé et converti en html sous Word 2000, il occupe 5146 octets (Figure 3). Il faut savoir que la conversion "en html" de Word 2000 est en fait une conversion en xml, qui accroît considérablement la taille du fichier par, entre autres, une définition prolixe du "style" du document.

L'on connaît les surprises dirigistes des logiciels Microsoft. Dans le contexte de l'extrait donné ci-dessus en exemple, j'en mentionnerai deux.

  • a) Quand je tape "dont votre serviteur", les versions anglaises de Word 97 et de Word 2000 "corrigent" "dont" en "don't" !
  • b) Quand je tape "http://www.cordis.lu", Word 97 et Word 2000 créent automatique un lien actif vers l'adresse web en question, que je le veuille ou non.

    Pour en savoir plus sur les surprises de Microsoft, on lira avec profit le livre de Di Cosmo et Nora, ou bien l'article "Piège dans le cyberespace" du premier. [NDLR: L'adresse de l'article ayant changé depuis novembre 2000, nous donnons un lien vers une version se trouvant en ligne au moment de la rédaction de cette note, le 2 novembre 2002.]

    Pour une introduction en français à la création intelligente de documents html, sans avoir à tâtonner dans le noir ou l'à-peu-près comme y obligent les conversions traitement de texte ou les éditeurs WYSIWYG ("what you see is what you get"), voir R. Wooldridge, Introduction au système de codage HTML pour la création de pages World Wide Web ou bien Comment créer un document web (documentation préparée en premier lieu pour des étudiants de première année). (ACRE, c'est aussi l'autonomisation de la création de ressources en ligne.)


    Figure 1: Source du texte-exemple sous WebEdit 2.0

    <html>
    <head>
    <title>R. Di Cosmo & D. Nora, Le Hold-up planétaire</title>
    </head>
    
    <body>
    <H3>La révolte des serfs</H3>
    
    [...] Microsoft Word autorise maintenant à sauvegarder ses
    fichiers en HTML, le langage du Web. D'un simple geste, vous
    pouvez donc envoyer à vos collègues des fichiers en HTML que
    tout le monde pourra lire, et non pas en klingonien version
    x.y, qui exige que votre interlocuteur ait, lui aussi,
    choisi de payer la taxe Microsoft.
    <P>
    De même, la France, la Communauté européenne, et les entités
    publiques en général, sont censées fournir toute information
    publique dans un format accessible à tous. Pourquoi
    faudrait-il acheter tel ou tel logiciel propriétaire pour
    pouvoir lire un texte de loi ou un appel d'offres? Encore une
    fois, de tels formats existent, présentent l'information
    correctement, et sont accessibles même à qui travaille en
    Word. Pourtant, malgré maintes lettres de protestations de la
    part d'innombrables scientifiques (dont votre serviteur), on
    trouve fréquemment sur des sites officiels de l'Union
    Européenne - comme <TT>http://www.cordis.lu</TT> - des
    documents lisibles seulement par la version la plus récente
    de Microsoft Word. Contre toute logique, et contre l'intérêt
    de tous.
    <P>
    C'est sans doute l'aspect à la fois le plus méconnu et le plus
    important de toute la question, parce que c'est précisément à
    travers le détournement de standards ouverts et l'introduction
    de standards propriétaires que Microsoft cherche à substituer
    ses propres produits aux innombrables applications libres et
    souvent gratuites, qui constituent le coeur de l'Internet.
    <P>
    (Roberto Di Cosmo & Dominique Nora, <I>Le Hold-up
    planétaire: la face cachée de Microsoft</I>, Calmann-Lévy,
    1998, p. 142-3.)
    </body>
    </html>
    

    Figure 2: Source du texte-exemple sous Word 97

    <HTML>
    <HEAD>
    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1252">
    <META NAME="Generator" CONTENT="Microsoft Word 97">
    <TITLE>dicosmo_word97</TITLE>
    <META NAME="Template" CONTENT="C:\PROGRAM FILES\MICROSOFT OFFICE 97\OFFICE\html.dot">
    </HEAD>
    <BODY LINK="#0000ff" VLINK="#800080">
    
    <B><FONT SIZE=4><P>La r&eacute;volte des serfs</P>
    </B></FONT><P>[...] Microsoft Word autorise maintenant &agrave; sauvegarder
    ses fichiers en HTML, le langage du Web. D'un simple geste, vous pouvez donc envoyer
    &agrave; vos coll&egrave;gues des fichiers en HTML que tout le monde pourra lire, et
    non pas en klingonien version x.y, qui exige que votre interlocuteur ait, lui aussi,
    choisi de payer la taxe Microsoft.
    </P>
    <P>De m&ecirc;me, la France, la Communaut&eacute; europ&eacute;enne, et les
    entit&eacute;s publiques en g&eacute;n&eacute;ral, sont cens&eacute;es fournir toute
    information publique dans un format accessible &agrave; tous. Pourquoi faudrait-il
    acheter tel ou tel logiciel propri&eacute;taire pour pouvoir lire un texte de loi ou
    un appel d'offres? Encore une fois, de tels formats existent, pr&eacute;sentent
    l'information correctement, et sont accessibles m&ecirc;me &agrave; qui travaille en
    Word. Pourtant, malgr&eacute; maintes lettres de protestations de la part d'innombrables
    scientifiques (don't votre serviteur), on trouve fr&eacute;quemment sur des sites
    officiels de l'Union Europ&eacute;enne - comme
    <FONT FACE="Courier New"><A HREF="http://www.cordis.lu">http://www.cordis.lu</A></FONT>
    - des documents lisibles seulement par la version la plus r&eacute;cente de Microsoft
    Word. Contre toute logique, et contre l'int&eacute;r&ecirc;t de tous. </P>
    <P>C'est sans doute l'aspect &agrave; la fois le plus m&eacute;connu et le plus
    important de toute la question, parce que c'est pr&eacute;cis&eacute;ment &agrave;
    travers le d&eacute;tournement de standards ouverts et l'introduction de standards
    propri&eacute;taires que Microsoft cherche &agrave; substituer ses propres produits
    aux innombrables applications libres et souvent gratuites, qui constituent le coeur
    de l'Internet. </P>
    <P>(Roberto Di Cosmo &amp; Dominique Nora, <I>Le Hold-up plan&eacute;taire:
    la face cach&eacute;e de Microsoft</I>, Calmann-L&eacute;vy, 1998, p.
    142-3.)</P></BODY>
    </HTML>
    

    Figure 3: Source du texte-exemple sous Word 2000

    <html xmlns:o="urn:schemas-microsoft-com:office:office"
    xmlns:w="urn:schemas-microsoft-com:office:word"
    xmlns="http://www.w3.org/TR/REC-html40">
    
    <head>
    <meta http-equiv=Content-Type content="text/html; charset=windows-1252">
    <meta name=ProgId content=Word.Document>
    <meta name=Generator content="Microsoft Word 9">
    <meta name=Originator content="Microsoft Word 9">
    <link rel=File-List href="./dicosmo_word2000_files/filelist.xml">
    <title>La révolte des serfs</title>
    <!--[if gte mso 9]><xml>
     <o:DocumentProperties>
      <o:Author>Russon Wooldridge</o:Author>
      <o:LastAuthor>Russon Wooldridge</o:LastAuthor>
      <o:Revision>2</o:Revision>
      <o:TotalTime>6</o:TotalTime>
      <o:Created>2000-11-26T08:39:00Z</o:Created>
      <o:LastSaved>2000-11-26T08:39:00Z</o:LastSaved>
      <o:Pages>1</o:Pages>
      <o:Words>232</o:Words>
      <o:Characters>1327</o:Characters>
      <o:Lines>11</o:Lines>
      <o:Paragraphs>2</o:Paragraphs>
      <o:CharactersWithSpaces>1629</o:CharactersWithSpaces>
      <o:Version>9.2720</o:Version>
     </o:DocumentProperties>
    </xml><![endif]-->
    <style>
    <!--
     /* Style Definitions */
    p.MsoNormal, li.MsoNormal, div.MsoNormal
    	{mso-style-parent:"";
    	margin:0cm;
    	margin-bottom:.0001pt;
    	mso-pagination:widow-orphan;
    	font-size:12.0pt;
    	font-family:"Times New Roman";
    	mso-fareast-font-family:"Times New Roman";}
    h1
    	{mso-style-next:Normal;
    	margin:0cm;
    	margin-bottom:.0001pt;
    	mso-pagination:widow-orphan;
    	page-break-after:avoid;
    	mso-outline-level:1;
    	font-size:14.0pt;
    	mso-bidi-font-size:12.0pt;
    	font-family:"Times New Roman";
    	mso-font-kerning:0pt;}
    p.MsoBodyText, li.MsoBodyText, div.MsoBodyText
    	{margin:0cm;
    	margin-bottom:.0001pt;
    	mso-pagination:widow-orphan;
    	font-size:11.0pt;
    	mso-bidi-font-size:12.0pt;
    	font-family:"Times New Roman";
    	mso-fareast-font-family:"Times New Roman";}
    a:link, span.MsoHyperlink
    	{color:blue;
    	text-decoration:underline;
    	text-underline:single;}
    a:visited, span.MsoHyperlinkFollowed
    	{color:purple;
    	text-decoration:underline;
    	text-underline:single;}
    @page Section1
    	{size:612.0pt 792.0pt;
    	margin:72.0pt 90.0pt 72.0pt 90.0pt;
    	mso-header-margin:35.4pt;
    	mso-footer-margin:35.4pt;
    	mso-paper-source:0;}
    div.Section1
    	{page:Section1;}
    -->
    </style>
    </head>
    
    <body lang=EN-CA link=blue vlink=purple style='tab-interval:36.0pt'>
    
    <div class=Section1>
    
    <h1>La révolte des serfs</h1>
    
    <p class=MsoNormal><span style='font-size:11.0pt;mso-bidi-font-size:12.0pt'>
    <![if !supportEmptyParas]> <![endif]><o:p></o:p></span></p>
    
    <p class=MsoNormal><span style='font-size:11.0pt;mso-bidi-font-size:12.0pt'>[...]
    Microsoft Word autorise maintenant à sauvegarder ses fichiers en HTML, le
    langage du Web. D'un simple geste, vous pouvez donc envoyer à vos collègues des
    fichiers en HTML que tout le monde pourra lire, et non pas en klingonien version
    x.y, qui exige que votre interlocuteur ait, lui aussi, choisi de payer la taxe
    Microsoft. <o:p></o:p></span></p>
    
    <p class=MsoNormal><span style='font-size:11.0pt;mso-bidi-font-size:12.0pt'>
    <![if !supportEmptyParas]> <![endif]><o:p></o:p></span></p>
    
    <p class=MsoNormal>De même, la France, la Communauté européenne, et les entités
    publiques en général, sont censées fournir toute information publique dans un
    format accessible à tous. Pourquoi faudrait-il acheter tel ou tel logiciel
    propriétaire pour pouvoir lire un texte de loi ou un appel d'offres? Encore une
    fois, de tels formats existent, présentent <span style='font-size:11.0pt;
    mso-bidi-font-size:12.0pt'>l'information correctement, et sont accessibles même
    à qui travaille en Word. Pourtant, malgré maintes lettres de protestations de
    la part d'innombrables scientifiques (don’t votre serviteur), on trouve
    fréquemment sur des sites officiels de l'Union Européenne – comme </span><span
    style='font-size:11.0pt;mso-bidi-font-size:12.0pt;font-family:"Courier New"'><a
    href="http://www.cordis.lu/">http://www.cordis.lu</a></span><span
    style='font-size:11.0pt;mso-bidi-font-size:12.0pt'> - des documents lisibles
    seulement par la version la plus récente de Microsoft Word. Contre toute
    logique, et contre l'intérêt de tous. <o:p></o:p></span></p>
    
    <p class=MsoNormal><span style='font-size:11.0pt;mso-bidi-font-size:12.0pt'>
    <![if !supportEmptyParas]> <![endif]><o:p></o:p></span></p>
    
    <p class=MsoBodyText>C'est sans doute l'aspect à la fois le plus méconnu et le
    plus important de toute la question, parce que c'est précisément à travers le
    détournement de standards ouverts et l'introduction de standards propriétaires
    que Microsoft cherche à substituer ses propres produits aux innombrables
    applications libres et souvent gratuites, qui constituent le coeur de
    l'Internet. </p>
    
    <p class=MsoNormal><span style='font-size:11.0pt;mso-bidi-font-size:12.0pt'>
    <![if !supportEmptyParas]> <![endif]><o:p></o:p></span></p>
    
    <p class=MsoNormal><span style='font-size:11.0pt;mso-bidi-font-size:12.0pt'>(Roberto
    Di Cosmo & Dominique Nora, <i>Le Hold-up planétaire: la face cachée de
    Microsoft</i>, Calmann-Lévy, 1998, p. 142-3.)<o:p></o:p></span></p>
    
    </div>
    
    </body>
    
    </html>