URL canonicales : redoublez d’efforts sur le contenu dupliqué

Des problèmes de contenu dupliqué ? Des problèmes avec vos balises canonicales ? Nous allons vous expliquer pourquoi ces problèmes se produisent et comment les réparer.

Les moteurs de recherche sont de plus en plus intelligents. Toutefois, dans un web dirigé par le CMS où le contenu peut souvent exister sur plusieurs URLs, il n’est pas toujours évident de trouver l’URL faisant autorité pour un contenu donné.

Il est déjà difficile de se démarquer dans ce paysage de recherche très compétitif, vous imaginiez donc que la plupart des entreprises avaient ces problèmes fondamentaux du SEO sous contrôle. Eh bien ce n’est pas le cas. Malheureusement, il semblerait que suite au changement vers le HTTPS de nombreux sites (avec la promesse d’un rang meilleur), nous voyons encore plus qu’avant des problèmes liés au contenu dupliqué basé sur les URLs.

Heureusement, nous avons le tag canonical. Avec rel=canonical, nous pouvons facilement indiquer l’URL faisant autorité pour n’importe quelle partie du contenu. Google et les autres moteurs de recherche consolideront ensuite le lien et classement pour toutes les variations de ce contenu vers une URL unique. Cela fonctionne bien évidemment si rel=canonical est correctement mis en place.

Des doublons douteux 

Il y a tout un tas de situations potentielles qui peuvent mener une partie de votre contenu disponible sur de multiples URLs, mais les tendances les plus communes sont les suivantes :

– URLs dynamiques — par exemple, http://exemple.com/?post=1&var=2&var=3

– Sites mobiles — par exemple, m.exemple.com and www.exemple.com

– Sites internationaux avec un ciblage géographique incorrect

– www et problèmes de sous-domaines — par exemple, www.exemple.com ou exemple.com

– CMS générant des URLs multiples

– Syndication de contenu sur d’autres blogs

– Site à la fois sous HTTP et HTTPS

Nous avons également tendance à voir un mix de ces problèmes, et il n’est pas inhabituel de trouver des sites qui fonctionnent sous HTTP et HTTPS et ont des contenus disponibles dans les versions www et non-www de leur site. Cela peut rapidement créer une situation où le même élément de contenu (ou la page d’accueil) peut être disponible sur plusieurs URLs différentes.

Un site avec et sans le www, et sous HTTP et HTTPS peut créer des URLs potentielles pour chaque partie du contenu sur le site. Voici un exemple :

– http://exemple.com/page

– http://www.exemple.com/page

– https://exemple.com/page

– https://www.exemple.com/page

URL canonicale

Maintenant, dans un monde idéal, votre URL canonicale résoudrait cela, et chacune des quatre URLs auraient la même URL canonicale spécifiée. Ça pourrait être n’importe laquelle d’au-dessus, mais si vous avez HTTPS, vous pouvez également l’exécuter avec HTTPS. Disons que votre URL canonicale est https://www.exemple.com. Vous mettrez cette partie de code dans la balise HTML de toutes les autres versions :

<link rel= »canonical » href= »https://www.exemple.com » />

Il existe des débats quant à la page canonicale actuelle, si elle devrait se donner une forme canonicale aussi ou non. En pratique, il le faut et les Traffic Manager le confirmeront.

Malheureusement, ce que nous voyons récemment est que la balise canonicale est présente, pourtant chaque page a une canonicale qui correspond à l’URL montrée dans la fenêtre du navigateur :

– http://exemple.com/page canonical = http://exemple.com/page

– http://www.exemple.com/page canonical = http://www.exemple.com/page

– https://exemple.com/page canonical = https://exemple.com/page

– https://www.exemple.com/page canonical = https://www.exemple.com/page

Clairement, ce n’est pas idéal. La balise canonicale est créée pour résoudre ces problèmes, mais dans cet exemple, ça exacerbe davantage la situation. Chaque URL ici est en train de dire, « Moi, moi, indexe-moi !!! » Le moteur de recherche doit ensuite faire ce qu’il peut avec ce désordre.

Des problèmes comme cela impactent la confiance. La confiance impacte le classement. Un mauvais classement impacte votre entreprise. Tout cela peut paraître comme quelque chose que le SEO Yoda pourrait dire, mais la réalité est qu’une balise canonical ratée impactera seulement vos résultats de façon négative.

HTTP et HTTPS

Le changement vers HTTPS est généralement une bonne chose. Pour des raisons de sécurité. Et le web est plus rapide qu’il ne l’était. Néanmoins, il existe toutes sortes de problèmes, généralement liés au site indexé sur les deux URLs HTTP et HTTPS.

Malheureusement, il est également fréquent de voir l’utilisation des balises canonicales sous HTTP et HTTPS, qui encore exacerbe le problème relevé que la balise canonicale devrait résoudre.

Pourquoi cela se passe ?

Il y a plusieurs raisons pour ces problèmes

1- Le site est sous HTTP et HTTPS, et le CMS n’a aucun moyen de forcer le protocole et/ou le sous-domaine pour les URLs canonicales

2- Les développeurs ont une approche « checklist »,  du SEO, mettant en place la balise canonical sans vraiment comprendre l’utilité et renseigner la balise avec l’URL de la barre d’adresse.

Corrigez vos canonicales

Dans la plupart des cas, les problèmes de contenu dupliqué peuvent être résolus relativement facilement. Réparer une canonicale est une façon, mais cela peut s’avérer être délicat avec quelques logiciels CMS, il est donc possible d’utiliser les redirections permanentes HTTP (301). C’est généralement l’approche la plus rapide et la plus logique. Google n’aura pas besoin d’analyser de multiples pages, il aura simplement à suivre la redirection.

1- Redirections 301. Si vous pouvez rediriger, faites une redirection. C’est l’approche la plus facile et à favoriser. Redirigez vers votre sous-domaine favori. Redirigez vers votre protocole préféré.

2- Canonicales correctes. Où une canonicale est exigée, vous devez mettre en place une canonicale d’une variation à une autre. Comme ci-dessous, déterminez votre principal sous-domaine et protocole, et assurez-vous que tous les doublons ont une canonicale pointant vers la page principale.

Une URL pour toutes les regrouper

Il est courant de voir des éléments du contenu sur plusieurs URLs. Il n’y pas de pénalité de contenu dupliqué en tant que tel. Toutefois, pour qu’un moteur de recherche soit sûr de renvoyer l’URL correcte et assurer que l’équité soit consolidée dans la première version de la page, nous avons besoin des URLs canonicales et de redirection précises.

Il ne suffit pas d’ajouter un plugin SEO ou avoir un développeur qui pirate une URL canonicale. Cela doit être mis en place de façon à ce que chaque élément du contenu ait une URL faisant autorité.

Une URL pour toutes les regrouper. Une URL pour les trouver. Une URL pour toutes les amener et toutes les lier dans les résultats de recherche.

Source : Search Engine Land – Marcus Miller