22.05.07 Google: positionnement (II)
Rubrique Référencement
Google, pour afficher ses résultats de recherche, prend en compte plus d’une centaine de critères qui sont ensuite utilisés dans un algorithme spécifique. Certains ont plus d’influence que d’autres, nous verrons les principaux. Notons qu’il existe des critères de pertinence internes à la page web mais aussi des critères externes.
Les critères de pertinences
Les principaux critères internes sont :
- Le titre des pages (balise <title>).
- Le contenu textuel des pages.
- La densité des mots clés.
- L’emplacement et la distance entre les mots clés.
- Le niveau hierarchique des titres (<h1> ... <h6>).
- L’utilisation de balises sémantiques sur certains mots.
- Le format des url.
- L’utilisation des balises <Meta> et des mot-clés associés.
Les critères externes sont :
- Le pageRank (indice de popularité basé sur l’aspect quantitatif et qualitatif des liens hypertextes internes ou externes pointant vers la page).
- Le texte des liens entrants.
D’autres facteurs peuvent favoriser le travail des moteurs de recherche comme par exemple la présence d’une page “plan du site”, les sitemaps XML, les fils d’Ariane, la fréquence de mise à jour des pages …
Dans cet article, nous allons passer en revue les critères internes, les critères externes seront abordés dans l’article intitulé “Google: positionnement (III)”
La balise <title>
C’est un critère de pertinence très influent. Il est conseillé de le placer le plus haut possible dans le code XHTML de la page.
Le titre doit être facilement compréhensible et refléter le contenu de la page (éviter les compilation de mots-clés), en effet le titre est :
- ce qui est présenté en premier par le moteur de recherche à l’internaute.
- ce qui s’affiche en premier sur le navigateur lorsque la page se charge.
- ce qui est utilisé dans le libellé du bookmark lorsque la page est stocké en favoris.
Choisir une expression qui utilise le plus possible les mots-clés qui ont été définies pour la description de l’activité.
Le titre d’une page d’accueil doit contenir :
- le nom de l’entreprise, entité, organisme …
- le qualificatif de votre activité (attention qu’il ne soit pas trop générique).
- le lieux géographique si cela a de l’importance.
D’autres conseils concernant les titres :
- Toutes les pages du site doivent avoir un titre différent et adapté à leur contenu.
- Un titre optimisé ne doit pas comporter plus de 10 mots.
- Ne pas répéter trop souvent un mot-clés sous peine d’être pris pour du spam par les moteurs.
- Si un mot est répété, espacer les dans l’expression.
- Si un mot caractérise fortement votre activité, essayer de le placer deux fois dans vos titres mais espacé dans l’expression.
- Coder les caractères accentués pour qu’ils apparaissent correctement à l’affichage.
- La case des caractères à peu d’influence sur les moteurs.
- Le masculin/féminin et le singulier/pluriel sont différenciés.
- Un site bilingue doit distinguer des pages, titres et mot-clés différents, ne pas mélanger le bilinguisme dans une même page.
- Les titres doivent être de plus en plus précis et pointus dans le vocabulaire au fur et à mesure que l’on s’enfonce dans l’arborescence du site.
- Enfin lors de la conception de l’arborescence du site, il vaut mieux fractionner son contenu en plusieurs petites pages à la thématique bien définie décrite par un titre précis et performant plutôt que de construire une vaste page abordant de nombreux thèmes avec un titre forcement peux représentatif du contenu.
Le texte visible
Il s’agit du texte lisible et qui peut être copier/coller. Une page optimisé contient 100 mots ou plus.
La position du texte
Plus un mot est placé en haut de la page près de la balise <body>, plus sa présence sera jugée pertinente par le moteur. Les 30-50 premiers termes, les 2-3 premières phrases sont primordiaux. Donc privilégiez le début de votre texte pour y placer le nom de l’entreprise et les mots-clés importants, pour reprendre ou développer le titre de votre page. Par exemple par une phrase l’accroche ou un chapo.
La mise en exergue du texte
Les moteurs de recherches accordent de l’importance aux mots mis en exergues par des balises tels que <strong> ou <em> etc. Attention, ne pas abuser des mots en gras au risque de rendre la lecture de vos documents inconfortables.
Servez-vous des balises <H> pour hierarchiser vos documents texte.
Les moteurs accordent également de l’importance aux mots utilisés pour faire un lien hypertexte. Utilisez donc vos mots-clés pour faire des liens vers d’autres pages plutôt que d’utiliser “cliquez -ici” ou “lire la suite”.
Le nombre d’occurrences des mots et indice de densité
Le nombre d’occurrences d’un mot est aussi appelé Indice de Densité de Mot (IDM). Il est égal au nombre d’occurences du mot dans la page divisé par le nombre total de mots dans le document. L’outil outiref.com vous permet de calculer cet IDM pour une page web en ligne. Cela peut être interessant de connaitre le mot le plus utilisé dans vos texte pour éventuellement en faire un mot-clé. Dans le texte de vos documents, essayez de ne pas dépasser un IDM de 10% pour vos mots-clés importants.
Les différentes formes, l’éloignement et l’ordre des mots
Les différentes formes :
Indiquez dans vos pages les différentes formes des termes susceptibles d’être saisis par les internautes dans les moteurs de recherche. En effet les moteurs distinguent les mots singuliers/pluriels, masculin/féminins mais aussi les mots ayant la même racine mais des sens différents. Notez que généralement il est difficile de positionner une page sur plus de 2-3 mots-clés ou expressions.
L’éloignement :
Privilégiez aussi les couples de mots et expressions si vous pensez que deux mots sont susceptibles d’être saisis l’un à côté de l’autre dans un moteur.
L’ordre des mots :
Dans une expression soyez attentif à l’ordre des mots car Google accorde plus d’importance au premier terme qu’au second.
La taille des pages
L’idéal est de proposer des pages monothématiques d’une 100 aines de mots minimum. Évitez les longues pages indigestes qui abordent plusieurs sujets.
La langue du texte
Faite des pages monolingues. Les moteurs traitent difficilement les pages qui utilisent plusieurs langues. Si votre site doit être traduit en deux langues, faite deux entités distinctes avec deux noms de domaine différents : monsite.com (ang) et monsite.fr (fr)
Les URL
Google accorde de l’importance à toutes les composantes de l’adresse de votre site. Il est donc intéressant, si cela est techniquement possible, d’y insérer un ou plusieurs mots-clés. Vous comprendrez alors qu’il est important d’avoir son propre nom de domaine si vous voulez optimiser votre positionnement dans les moteurs.
Les sites dynamiques génèrent des url complexes comportant des paramètres ou des identifiants de session qui ne favorise pas le travail des moteurs de recherche.
Si vous achetez un nom de domaine qui comporte plusieurs mots, préférez de les séparer par un (-) car Google fera la distinction entre les deux mots. Cela ne sera pas le cas si les deux mots sont attachés.
Les identifiants de session
Les identifiants de sessions sont affectés de manière automatique à chaque visite sur le site pour la durée de la session. Comme cet identifiant est transmis en général dans l’URL, une même page se voit attribué une URL différente à chaques visites. C’est la raison pour laquelle, le robot de Google n’index pas ces pages. Les identifiants de sessions peuvent être stockés dans un cookie mais Google refuse le stockage des cookies sur ses machines.
Des solutions peuvent être envisagée :
- Utiliser le système de sessions uniquement dans certains cas spécifique (activation d’un panier e-commerce).
- Gérer la session par cookie sur une seule page pour ne pas pénaliser les autres pages.
- Détecter la visite d’un moteur via son IP dans le script de gestion de la session pour désactiver l’attribution d’un identifiant de session si une visite de robot est repérée.
Masquer les paramètres grâce à la réecriture d’url
La réecriture d’URL ou ReWriting s’obtient en PHP et sur serveur Apache à l’aide d’un fichier “.htaccess”
Pour effectuer de la réecriture d’URL il faut :
- vérifier que son hébergeur a activé les fonctions de ReWriting.
- répertorier le format de toutes les URL qui comportent des paramètres et choisir un nouveau schéma d’URL propre (pensez aussi aux forums).
- écrire les règles de réécriture à l’aide d’expressions régulières dans le fichier “.htaccess”.
Les balises <meta>
Ces balises HTML permettent de transmettre aux moteurs de recherche des informations sur le contenu d’une page web. Elles se placent juste après la balise <title> entre les balises <head></head>. Notez qu’elles ont moins d’importance pour les moteurs qu’elles en avaient auparavant.
<meta name="description" content="contenu de la description"/>
Cette balise permet de maîtriser la façons dont les moteurs présentent vos documents dans leurs résultats mais ce n’est pas un critère de pertinence important pour le positionnement. 150 à 200 caractères sont suffisant (espaces compris). L’utilisation de mots-clés dans cette description est biensure recommandée. Il est judicieux de reprendre le titre (7 à 10 mots) et de le développer dans la limite des 200 caractères. Pour être plus efficace mettre une balise meta avec une description spécifique dans chacune des pages du site.
<meta name="keywords" lang="fr" content="mots-clés"/>
20 à 30 mots suffisent en général. Utilisez des mots mais aussi des expressions.
Les mots-clés sont séparés par un espace, une virgule ou virgule+espace. Il est conseillé de coder les caractères spéciaux.
L’influence de cette balise semble faible aujourd’hui surtout pour Google, mais elle peut être utilisée pour indiquer :
- plusieurs orthographes susceptibles d’être saisies par l’internaute.
- indiquer d’autres mots-clés non cités dans le site.
- indiquer des mots en version féminin/masculin, singulier/pluriel, majuscule/minuscule.
Les autres balises meta n’ont pas d’influence dans l’amélioration du positionnement de votre site.
L’attribut “alt” de la balise <img>
Son impact est mineur pour le référencement mais son utilisation est réclamé par le W3C pour obtenir un code standard.
Il semble pris en compte par Google sur les images insérées dans un lien hypertexte.
Les commentaires
Les commentaires ne sont pas pris en compte par Google.
Mes sources
- “Google trucs de pros” Olivier Andrieu et Olivier Duffez - Micro Application
Abonnement au flux RSS
Pas de commentaire - S'abonner aux commentaires via RSS - (URL de trackback)