Le duplicate content

Explication du terme: Duplicate content

En français, "duplicate content" signifie "duplication de contenu". Les mots parlent d'eux-mêmes et il n'est pas difficile de comprendre qu'il y a duplicate content à partir du moment où le contenu d'une page web se retrouve à l'identique sur une autre page; le contenu est simplement dupliqué.

Les cas de duplicate content

Il existe plusieurs cas typiques où l'on trouve le duplicate content, en voici quelques-uns: Plusieurs noms de domaine Il n'est pas rare de voir des éditeurs de sites web acheter plusieurs noms de domaine pour un même site. Il s'agit parfois du même nom de domaine avec des extensions différentes .be .com .net... Il peut également s'agir d'une simple variation de l'intitulé: mer-du-nord.be et merdunord.be Le seul intérêt d'une telle démarche, et non des moindres, c'est d'être certain que chaque nom de domaine vous appartient. Ensuite, il convient de choisir le nom de domaine principal sur lequel vous souhaitez travailler et de faire une simple redirection 301 des autres vers le principal. Mais en aucun cas placer le même site sur chaque nom de domaine car c'est un gros risque de duplicate content. Avec ou sans www. Il existe un autre cas typique de duplicate content, mais celui-ci mieux géré par les moteurs. Il s'agit de l'utilisation ou non du www dans la diffusion des liens vers un site. Explications: Par défaut, un site se trouve à l'adresse formée de http:// suivi de nom-de-domaine suivi de .extension. La présence du www. dans l'adresse est facultative puisqu'il s'agit en réalité d'un sous-domaine. C'est ainsi que l'on peut accéder à un site en tappant http://google.be ou http://www.google.be. Le même contenu se retrouve à deux adresses différentes et c'est un cas de duplicate content. Heureusement, les moteurs ont su gérer ce cas particulier mais il est possible également d'utiliser les redirection 301 pour éviter le phénomène. Google propose même de choisir dans son interface d'administration Webmastertools lequel des deux doit être pris en considération, avec ou sans www. Pages dynamiques et url rewriting La technique d'url-rewritng qui consiste à présenter aux moteurs des pages html "virtuelles" à la place des pages dynamiques contribue elle aussi à produire du duplicate content si on ne prend pas garde à utiliser les mesures qui s'imposent.

Les risques du duplicate content

L'inconvénient du duplicate content, c'est de ne pas être du tout apprécié des moteurs. Le risque est donc d'être désindexé ou mal positionné dans les résultats des recherches.

Comment éviter le duplicate content?

Puisque le duplicate content consiste en des pages ayant des adresses différentes pour présenter un même contenu, il suffit d'indiquer aux moteurs au moyen d'un fichier robot.txt ou d'un fichier .htaccess quelles sont les pages que l'on souhaite référencer et celles que l'on ne souhaite pas. C'est aussi simple que cela en théorie mais parfois un peu plus casse tête en pratique selon l'architecture du site. Cet outil de WebRankInfo vous permet de connaître le pourcentage de similitude entre deux pages. Celui-ci de Copyscape repère les pages qui ont un contenu similaire au votre.

Besoin d'un cahier des charges pour votre site?
Générateur de cahier des charges pour un site internet

Lexique du web

Ce lexique vous permet de trouver des explications sur les termes spécifiques au jargon du web.

Lexique

Pas à pas

Suivez notre guide pour la création de votre site web.

Pas à pas
Devis gratuit

Nos conseils

N'hésitez pas à parcourir nos conseils pour la création d'un site.

Nos conseils

Pour aller plus loin

Pour aller plus loin dans dans la création d'un site web, nous vous proposons également une série d'articles complémentaires à notre pas à pas.

Plus d'articles