Outil d'analyse syntaxique de documents HTML

Présentation

Ce logiciel permet de vérifier la syntaxe d'un fichier HTML. Pour le moment il se limite au contrôle des balises. Les attributs sont ignorés. Outre les balises HTML, le logiciel reconnait les balises VML (Vector Markup Language), WSH (Windows Scripting Host) et WSC (Windows Script Component).

Il contrôle la concordance entre les balises d'ouverture et de fermeture des éléments HTML. Les divers types de balises sont repérés par un code de couleurs.

Il est possible d'enregistrer le fichier corrigé après analyse. Le fichier résultat porte le même nom que le fichier source, avec un numéro de copie entre parenthèses pour le différencier. Il est rangé dans le même dossier. Ce procédé réduit le risque de destruction accidentelle du fichier source. L'utilisateur doit supprimer ou renommer lui-même les fichiers obtenus.

L'analyse et l'enregistrement des corrections ont pour but de faciliter le travail de correction mais ne prétendent pas donner un résultat parfait. Les erreurs ne sont pas forcément à l'endroit où le logiciel les a détectées ; elles peuvent également perturber l'analyse de la suite du texte. C'est pourquoi il convient d'examiner le résultat de l'analyse avec un œil critique. Il est recommandé - s'il y a beaucoup d'erreurs - de « dégrossir » l'analyse en faisant plusieurs passes de correction.

Remarque importante : Les « erreurs » n'en sont pas forcément. Par exemple, pour le W3C (organisme qui supervise la norme HTML entre autre) on n'est pas obligé de fermer un élément <P>. De même, la balise </LI> n'existe pas ; une ligne <LI> se termine au <LI> suivant ou à la fin de l'élément englobant. J'ai choisi personnellement - pour une bonne structuration du HTML - de placer ces balises. Le contrôle en est facilité - en particulier avec ce logiciel...

Installation

Cet outil a pour principal support un fichier « application HTML » (.HTA) ; il n'est donc utilisable que sur le bureau et ne peut être placé ni dans une page Web ni dans un message.

Si ce n'est déjà fait, téléchargez et dézippez le fichier outils.zip. Un dossier sera créé contenant les fichiers utiles pour ce logiciel et d'autres - documentés par ailleurs.

L'outil « Syntaxe HTML » pourra être appelé après l'installation via le menu contextuel « envoyer vers » d'un fichier. A cet effet, un raccourci vers l'outil doit être rangé dans le dossier système « sendTo ». Cette opération sera faite automatiquement - et une seule fois - en cliquant sur le fichier « syntaxeHtml.wsf », après réponse positive à une demande de confirmation. Par la suite, ce fichier ne pourra plus être appelé directement.

Contrôle d'un fichier HTML

Vous avez le choix entre plusieurs procédés pour mettre en œuvre le contrôle de syntaxe HTML sur un fichier :

A partir de la fenêtre du logiciel :
Cliquez sur le nom de fichier syntaxeHtml.hta dans le dossier du logiciel puis recherchez le fichier à contrôler en cliquant sur le bouton « Rechercher un fichier ».
Par tirer/lâcher du fichier à contrôler :
Tirez/lâchez le fichier à contrôler depuis son dossier vers le nom de fichier syntaxeHtml.wsf dans le dossier du logiciel.
A partir du menu clic droit du fichier à contrôler (seulement si vous avec préalablement créé un raccourci comme expliqué plus haut) :
Faites un clic droit sur le fichier à contrôler et choisissez « Envoyer vers » puis « Syntaxe HTML ».

Codage du résultat de l'analyse

Texte
Texte hors balise.
<DIV>
Balise de début identifiée.
</DIV>
Balise de fin identifiée.
<IMG ...>
Balise d'un élément HTML vide. Ne doit pas comporter de balise de fin.
</DIV>
Balise non identifiée ou mal placée.
</DIV>
Balise de fin ajoutée pour assurer la concordance.
<!-- commentaire -->
Balise de commentaire. Affichée sans modification.
libellé
Contenu d'un élément script. Affiché sans modification.

Options

Sans option particulière, l'affichage est effectué de façon identique au fichier original - aux couleurs des balises près. Les changements de lignes et espacements sont inchangés par rapport au fichier original.

Les options possibles - indiquées par des cases à cocher - sont décrites ci-dessous. L'affichage est recalculé dès qu'on modifie une option.

Affichage arborescent
L'arborescence des éléments HTML est matérialisée par un changement de ligne à chaque balise et une tabulation plus ou moins importante vers la droite. Cette mise en page ne concerne que l'affichage ; si on enregistre le fichier, l'ancienne mise en page est conservée.
Affichage et enregistrement arborescent
Identique au précédent mais cette fois la mise en page arborescente est prise en compte si on enregistre le fichier.
Noms des balises en majuscules
Les noms de balises sont mis en majuscules ; à l'affichage comme à l'enregistrement.
Ajout des balises manquantes
Les balises de fin qui sont affichées comme étant manquantes sont prises en compte à l'enregistrement. Cette option est cochée au départ car elle repère d'une façon assez sure les fermeture manquantes (s'il n'y a pas d'autres types d'erreur).
Suppression des balises superflues
Les balises de fin qui sont affichées comme étant superflues sont supprimées à l'enregistrement. Cette option n'est pas cochée au départ car il semble que cette erreur soit généralement le résultat apparent d'autres erreurs.