Mise en forme HTML
La balise <title>
Lorsqu’un site fait partie d’une liste de résultats de recherche, il apparait dans une SERP sous forme d’un lien cliquable pointant vers la page trouvée.
Affichage du contenu de la balise <title> sur Google
Le libellé de ce lien est le titre de page, il est défini par la balise <title> de ladite page.
Exemple de balise <title>
Pour être aussi efficace que possible :
- la balise doit être placée aussi haut que possible dans le code HTML de la page ;
- elle doit contenir 8 mots maximum en moyenne (voire moins), soit un nombre moyen maximum de 65 caractères ;
- elle doit contenir autant de mots clefs importants que possible (éviter les titres tels que « page d’acceuil », nom de l’entreprise, etc.) ;
- les mots clés les plus importants doivent se trouver à gauche dans la balise <title> ;
- Les mots clefs choisis dans la balise <title> doivent être cohérents avec le contenu de la page ;
- La balise <title> doit être unique pour chaque page, et présente sur chaque page.
Les balises <h1>, <h2>, <hn>
Il est conseillé d’organiser les contenus d’une page web en paragraphes. Chaque paragraphe peut, par exemple, être titré avec un titre de niveau 2, c’est à dire un « heading » de type <h2>. Les « headings » autrement appelé balise <hn> servent à hiérarchiser les titres accompagnant des textes entre eux. Les mots clefs contenus dans la balise <h1> ont plus de poids que ceux de la balise <h2>, et ainsi de suite.
- Il existe jusqu’à 8 niveaux de titre, mais il est recommandé d’en utiliser 3 maximum.
- Les titres <hn> doivent contenir le moins de mots possible.
- Les mots peu porteurs diluent l’impact SEO des mots clefs importants.
- Chaque page contient un seul et unique <h1>.
- La hiérarchie des titres est à respecter (le <h1> apparait avant le <h2>, par exemple).
- Un titre <hn> est un titre… pas une longue phrase et encore moins un paragraphe.
La mise en gras
La mise en exergue de mots dans le contenu de votre site a un double avantage.
- Elle améliore la lisibilité du contenu en indiquant aux lecteurs les éléments clés de la page ; ils peuvent ainsi trouver plus facilement l’information qu’ils recherchent. Cette logique se retrouve dans les pages de résultats de Google : les mots de la requête tapée par l’internaute apparaissent en gras dans la liste des résultats : balise title, url et méta description. D’où l’importance de placer son mot-clé stratégique dans ces zones pour inciter les internautes à cliquer sur votre page.
- La mise en relief (mise en gras) de certains éléments confère plus de poids à ces mots aux yeux de Google. Dans sa lecture d’une page, le robot de Google ne peut pas savoir quel mot est plus important qu’un autre ; la mise en valeur par le gras est un moyen d’indiquer à Google qu’un mot a une valeur significative dans un texte, même si l’impact de cette mise en valeur est relativement faible.
Les liens internes
Il peut être utile d’incorporer des liens internes aux articles de votre site. Les moteurs de recherches suivront ces liens, l’internaute également, avec pour résultat de générer du trafic et faire comprendre aux moteurs de recherches que votre page est pertinente. Les liens utilisés devront comporter une « ancre« . Cette ancre décrira le lien vers l’article, elle doit donc être descriptive. Egalement vous pouvez utiliser l’attribut strong (en mettant la balise de lien en gras), afin de rendre important ce lien aux yeux des moteurs de recherches.
Nota:
Il est conseillé d’utiliser la cible de lien target= »blank_ » afin d’ouvrir votre page dans un nouvel onglet, pour éviter que l’internaute quitte votre page en cliquant sur le lien interne.
Les balises meta
En HTML, les balises meta permettent de fournir aux moteurs de recherche un certain nombre d’informations sur le contenu d’une page web. « meta » est une abréviation de « metadata » (métadonnée), ces balises signalent donc « de l’information sur l’information ».
Il est important de noter que les balises meta ont aujourd’hui moins d’importance pour les moteurs de recherche qu’il y a quelques années en termes de critère de pertinence et de positionnement. Trop de spam a été réalisé au travers de cette zone et, petit à petit, les moteurs se sont lassés de prendre en considération des informations qui auraient dû être très pertinentes et qui tournaient, in fine, au « réservoir à spam ».
Toutefois, même si leur impact sur le positionnement a diminué de façon significative, les balises meta demeurent un moyen d’optimiser vos pages web.
De très nombreuses autres balises meta sont disponibles et parfois visibles dans le code HTML des pages rencontrées au cours de vos pérégrinations sur le Web : revisit-after, classification, distribution, rating, identifier-URL, copyright, etc. Elles ne sont clairement prises en compte par aucun moteur de recherche majeur. Leur présence est donc superflue dans vos pages, si ce n’est pour d’autres buts que le référencement. Très peu ont un véritable intérêt : les balises meta description, robots, new_keywords et dans une très moindre mesure (obsolète), keywords.
La balise meta description
La balise Meta Description est utile pour donner une courte description de la page. Google et d’autres moteurs de recherche s’en servent parfois pour présenter une page web dans ses résultats de recherche. Google ne tiendrait pas compte de cette balise pour le référencement / positionnement. Cependant, une description bien rédigée incite généralement l’internaute à cliquer. En augmentant le taux de clic (« click-through rate », la balise meta description augmente ainsi le trafic du site, indépendamment de sa position dans les résultats de recherche.
Affiche de la valeur de la balise meta description
- La longueur de la balise Meta Description a varié plusieurs fois entre 2017 et 2018, et semble s’être stabilisée autour de 165 caractères sur ordinateur et 130 caractères sur mobile, espace compris
- Synthétique, la balise Meta Description permet d’informer les moteurs de recherche, ainsi que les internautes du contenu de la page
- Il ne s’agit pas d’une simple série ou liste de mots-clés
- La description est rédigée de façon unique par page
La balise meta keywords
Autrefois pilier de la détermination de la pertinence d’une page web, il est aujourd’hui admis que la balise meta keywords n’a plus d’impact positif sur le référencement naturel, excepté pour le moteur de recherche … yandex (orienté vers le marché russe). Deux courants de pensée s’affrontent à ce sujet.
- Utiliser la balise meta keywords (en saisissant en moyenne une vingtaine de mots), pour la forme et entre autres, pour inclure dans les mots-clés, des mots du même champ lexical, ou des erreurs d’orthographe courantes.
- Ne pas l’utiliser du tout : « pourquoi offrir à la concurrence un aperçu, même partiel, des mots clés de votre stratégie SEO ».
La balise meta robots
La balise meta robots est une balise HTML située dans l’entête HTML, c’est-à-dire entre les balises <head> et </head>. Facultative, elle permet de fournir quelques directives aux robots des moteurs de recherche, par exemple pour interdire l’indexation de la page (robots noindex).
La syntaxe est très simple : <meta name= »robots » content= »noindex » />.(exemple en XHTML ou HTML5)
Pour indiquer plusieurs valeurs dans « content », il faut les séparer par une virgule comme dans cet autre exemple :
<meta name= »robots » content= »noindex,notranslate » />
La similitude d’orthographe avec le nom du fichier robots peut susciter des questions. Voici la nuance :
- la balise meta robots sert à fournir des directives aux robots quand ils consultent une page spécifique
- le fichier robots.txt sert à indiquer aux robots s’ils ont le droit d’accéder à une page ou un groupe de pages du site
En résumé :
- pour interdire en amont le crawl (et donc l’indexation) d’une page, bloquez-la dans le fichier robots.txt
- pour interdire l’indexation d’une page (autorisée au crawl), mettez une balise meta robots noindex dedans
- attention : si une page est déjà indexée et que vous souhaitez la supprimer de Google, ne la bloquez pas au crawl (dans le robots.txt), car même si vous mettez aussi une meta noindex, Google ne consultera pas la page (à cause du robots.txt) et ne la désindexera pas.
BALISE meta robots | SYNTAXE | SIGNIFICATION | |
1. | Index | <meta name= »robots » content= »index » /> | Indique au robot qu’il peut indexer la page. Cette valeur étant celle par défaut, il est inutile de l’indiquer. |
2. | Follow | <meta name= »robots » content= »follow » /> | Indique au robot qu’il peut suivre les liens dans la page. Cette valeur étant celle par défaut, il est inutile de l’indiquer. |
3. | All | <meta name= »robots » content= »all » /> | Cette valeur est l’équivalent de index,follow. Cette valeur étant celle par défaut, il est inutile de l’indiquer. |
4. | None | <meta name= »robots » content= »none » /> | Cette valeur est l’équivalent de noindex,nofollow. |
5. | Nosnippet | <meta name= »robots » content= »nosnippet » /> | Indique au robot qu’il ne faut pas afficher de descriptif (snippet) dans la page de résultats. |
6. | Noarchive | <meta name= »robots » content= »noarchive » /> | indique au robot qu’il ne faut pas laisser l’accès à la version en cache. Le lien « En cache » dans la page de résultats ne sera donc pas affiché. Ceci peut servir à ceux qui passent leur contenu d’une version publique accessible à une version archivée payante (sites de journaux par exemple). L’inconvénient est que le webmaster ne peut plus savoir à quelle date (et heure) Google a indexé la page la dernière fois (il peut toujours voir la date de dernier crawl dans ses fichiers logs) |
7. | Nocache | <meta name= »robots » content= »nocache » /> | identique à noarchive, ceci est pris en compte par Bing mais pas par Google |
8. | Notranslate | <meta name= »robots » content= »notranslate »/> | indique à Google que l’on ne souhaite pas qu’un lien Traduire soit affiché à côté du résultat de recherche. |
9. | noimageindex
|
<meta name= »robots » content= »noimageindex »/> | indique à Google qu’aucune image située sur cette page ne doit être indexée dans Google Images. |
10. | Noodp | <meta name= »robots » content= »noodp » /> | indique au robot qu’il ne faut pas utiliser les données associées au site par les éditeurs de l’annuaire DMOZ (Open Directory Project, ODP). |
11. | unavailable_after | <meta name= »robots » content= »unavailable_after:25-Aug-2007 15:00:00 EST » /> | indique au robot que la page ne doit pas ressortir dans les résultats après la date indiquée (au format RFC 850). |
12. | noydir
|
<meta name= »robots » content= »noydir » /> | Seul Yahoo gère cette valeur noydir. Elle indique au moteur qu’on ne souhaite pas que les données de l’annuaire Yahoo (Yahoo Directory) soient utilisées. |
Syntaxe et utilisation de la balise meta robots
La balise new_keywords pour Google Actualités
La balise meta news_keywords permet – pour Google Actualités uniquement – d’indiquer des mots clés permettant de mieux décrire un article, notamment si le titre n’est pas explicite.
- Elle doit être positionnée, comme toutes les balises meta, dans la partie HEAD du code source.
- Les mots qu’elle contient ne doivent pas nécessairement apparaître dans le contenu de l’article (même si, logiquement, on peut s’attendre à ce que ce soit le cas pour certains d’entre eux). La balise peut également servir pour proposer des synonymes, autres formes de mot (singulier, pluriel ou autres) ou tout terme relatif au contenu de l’article en question.
- Ces mots clés sont pris en compte dans l’algorithme de « ranking » de Google News mais ils ne suffiront pas, bien sûr, pour que la page soit bien classée dans les résultats pour ces termes s’ils n’apparaissent que dans cette zone.
- Une virgule doit séparer les expressions ou groupes de mots clés (la virgule est le seul signe de ponctuation autorisé).
- On peut ajouter jusqu’à dix mots clés ou expressions pour un article. Tous les mots clés ont la même valeur, l’importance accordée au premier n’étant pas supérieure à celle accordée au dernier mot clé.
Exemple d’utilisation :
<meta name= »news_keywords » content= »balise, html, google, actualité, news keywords, seo, référencement, news »>
Les attributs alt et title
De nombreux webmasters soignent les attributs alt et title (servant à l’accessibilité et à l’affichage de texte alternatif en l’absence d’image), dans les balises images et les liens du code HTML de leurs pages web, pensant que le contenu de ces options est pris en compte comme du texte par les moteurs de recherche.
Exemple de code HTML de ce type :
<img src= »http://www.votresite.com/images/logo.gif » alt= »Mots-clés » title= »Autres mots-clés »>
L’attribut ALT fait référence à une alternative (ALT) de texte, qui est intégrée dans le fichier image sur un site web et qui décrit le contenu du graphique en question. Si l’image ne peut pas être affichée pour n’importe quelle raison, le texte de l’attribut ALT intégré apparaîtra. Les moteurs de recherche utilisent cet attribut pour reconnaître le contenu des images, car les fichiers images ne sont normalement pas directement lus.
L’attribut title (ou attribut universel), quant à lui, présente à l’utilisateur des informations au sujet de l’image après un léger décalage, quand on passe le curseur sur l’image
En théorie, il n’y a pas de limite de longueur de texte pour un attribut ALT. Cependant, il est conseillé de n’utiliser que quelques mots pour décrire de manière informative votre image et pour transmettre les informations essentielles aux moteurs de recherche.