Évitez les URLs dupliquées
Tout comme la problématique sur les URLs avec ou sans www, toutes les sortes de contenus dupliqués peuvent, potentiellement être un problème pour votre positionnement dans les résultats des moteurs de recherche.
Vous devez vous assurer bien sûr, que le contenu de vos articles est unique et non copier d'autres sources ou réutilisé dans d'autres parties de votre site, mais vous devez aussi être sûr que la même page ne puisse être accessible sous différentes URLs.
Beaucoup de CMS open source ont souvent cette problématique et Joomla en fait partie. Même si vous avez activer la réécriture d'URLs dans la configuration de votre site Joomla, les Urls non réécrites existent toujours. En clair 2 URLs permettent d'accéder au même contenu, et souvent beaucoup plus que 2.
Les URLs dupliquées peuvent exister pour les raisons suivantes :
- Des URLs avec ou sans www, tel que détaillé dans l'article précédent.
- Des URLs de pages se terminant par index.html, index.php, etc, et qui montrent le même contenu que la page sans ce suffixe.
- Des paramètres d'URLs tels que ..../page1?font-size=large
- Des trailing slashes
- Parfois des problèmes de lettres en capitales ou minuscules
- Et pour Joomla : le même article accessible depuis différents éléments de menu
- Des URLs non réécrites toujours accessibles, même si vous avez activé la réécriture d’URLs
Avoir des pages accessibles depuis de multiples URLs peut nuire à votre positionnement. Aussi est-il préférable de se prémunir contre cette problématique, ceci peut être fait de différentes façons. Même si certaines de ces solutions semblent uniques, vous pouvez les combiner pour complétement éradiquer votre site de ces URLs dupliquées :
1. Bien définir ses éléments de menu
L'une des causes courante d'URLs dupliquées provient du simple fait qu'un article Joomla est accessible depuis différents éléments de menu. C'est souvent le cas lorsqu' un article est accessible depuis un élément de menu de votre menu principal mais aussi depuis un élément de menu de votre menu en pied de page. Dans ce cas Joomla construit l'URL de la page à partir de l'élément de menu. Comparons maintenant 2 exemples :
- Si vous avez un menu nommé Produits, avec un sous élément de menu pour chacun de ces produits, l'URL de l'article Chaise sera /index.php/produits/chaise
- Si ce même article est accessible directement depuis votre menu en pied de page sans que ce soit un sous élément de menu, l'URL sera /index.php/chaise
Mise à part des éléments comme le fil d'ariane ou l'assignement de certains modules, ces pages sont identiques, et rentrent complètement dans la problématique des URLs dupliquées. Ce qui provient en partie de la façon dont Joomla fonctionne, mais il y a des solutions dans la plupart des cas :
- Parfois le menu principal est répété en pied de page. Si c'est le cas et à partir du moment ou il exactement identique, il vous suffit simplement de le publier aussi dans la position pied de page de votre template, mais surtout ne récréé pas un nouveau menu avec des liens identiques.
- Il est assez courant d'avoir des éléments de menu de différents menu que l'on souhaite voir pointer vers le même article. Dans ce cas, ne recréé pas un nouveau lien de menu de type "article" mais un lien de menu de type "Alias de menu" (rubrique lien divers). Ce qui aura pour effet de reprendre l'URL originale du sous élément de menu vers lequel pointe cet alias, ainsi il n'y aura pas de nouvelles URLs de créées!
2. Définir la balise canonical pour la bonne page
Si vous définissez la balise canonical pour la bonne page, vos URLs non réécrites ne seront pas indexées. Il y a différentes façons d'y parvenir, mais pour ce faire vous devez être un utilisateur Joomla expérimenté. En effet si vous ne définissez pas de façon correcte cette balise, vous pourriez produire l'effet inverse de celui escompté.
La solution la plus simple pour la mette en place est probablement d'utiliser une extension Joomla. La plus part des extensions SEF vous proposeront ce type de paramétrage.
Si vous mettez en place cette balise correctement, toutes les pages dupliquées de Joomla contiendront cette balise dans le code <head> de leur page. Un exemple avec la page ci-dessous qui peut être consultée par 2 URLs différentes:
- http://joomlaseo.com/index.php?option=com_content&Itemid=125&catid=15&id=18&lang=en&view=article
- http://joomlaseo.com/Checklist/avoid-duplicate-url-s
La première URL est actuellement redirigée, mais si ce n' était pas le cas, en insérant l'URL canonical, Google comprendra qu'il s'agit de la même page que l'URL réécrite :
<link href="/Checklist/avoid-duplicate-url-s" rel="canonical"/>
En utilisant cette technique, vous indiquerez à Google de ne pas indexer le Urls dupliquées, même si elles restent toujours accessibles.
La seule option que vous pouvez définir dans Joomla se trouve dans les paramètres du plugin System - SEF. Il vous permet de définir le domaine du site. Cependant cela ne vous sera utile uniquement si vous définissez votre site comme accessible depuis de multiples domaines, en vous permetant de définir le domaine canonique.
Vous devez être conscient qu'en ce moment (Joomla 3.2, problème réglé depuis avec Joomla 3.2.1) il peut y avoir des problèmes avec la façon dont les URLs canonicals sont traitées. Vous aurez peut être besoin d'une extension pour les définir tel que vous le souhaitez.
3. Créer des redirections 301
Utiliser des redirections 301 revient à spécifier que l'adresse d'une page a été changée de façon permanente et renvoient les internautes ou moteurs de recherche vers sa nouvelle adresse :
http://joomla-seo.net/index.php?option=com_content&Itemid=125&catid=15&id=18&lang=en&view=article
est renvoyée vers :
http://joomla-seo.net/Checklist/avoid-duplicate-url-s
Vous pouvez définir des redirections 301 soit dans votre fichier .htaccess, ou en utilisant une extension telle que RedJ, une extension très simple pour créer ce type de redirection.
Plus d'informations sur les redirections 301 sont disponibles dans l'article rediriger ses vieilles URLs.
4. Définir des régles dans son .htaccess
En utilisant le fichier .htaccess de Joomla vous pouvez résoudre un nombre important du problèmes d' URLs dupliquées (à condition que la réécriture d'URL soit activée). Nous avons déjà vu comment rediriger ses URLs avec www vers le sans www, mais vous pouvez aussi éliminer les trailing slashes :
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]
Testez si le trailing slash a bien disparu et que votre site soit toujours fonctionnel. Soyez toujours prudent avec toutes les modifications que vous apporter au .htaccess !
Des problèmes similaires peuvent se poser du fait de certains paramètres, comme la mise en place de taille de police, peuvent conduire Google peut à penser que 2 pages existent :
- /contact.php
- /contact.php?font-size=larger
5. Utiliser le fichier robots.txt
Vous pouvez modifier votre fichier robots.txt de telle façon que toutes les URLs contenant une chaîne de requête, c'est à dire un ?, ne soient pas indexées, consulter l'article sur le robots.txt pour le code à insérer. Cette solution résout les problèmes des URLs dupliquées dus aux URLs non réécrites, mais aussi dus aux chaînes de requête, tel que :
- /contact.php
- /contact.php?font-size=larger
6. Utiliser une extension
Pour de petits sites, ces problèmes peuvent être facilement résolus en configurant son .hatccess ou son robots.txt et en utilisant une petite extension pour créer les redirections 301, mais pour des sites plus gros utiliser une extension SEF est probablement plus efficace.
Comme cela prends du temps à s'habituer à ce type d'extensions, tester vous sur un site de moindre importance. Si elle est bien utilisée elle éradiquera tous les problèmes d'URLs dupliquées de votre site. Mais si elle est mal utilisée elle pourrait produire l'effet inverse.
Voici quelques extensions SEF bien connues :
Consultez la section extension de ce site http://joomlaseo.com/SEO-extensions/ pour plus d'informations sur ces extensions et quelques autres.
7. Google Outils pour les Webmasters
Google Outils pour les Webmasters est une autre solution pour se débarrasser des URLs dupliquées. Mais de préférence, vous devriez utiliser les techniques listées ci-dessus, pour vous prémunir du listing des URLs dupliquées dans Outils pour les Webmasters, et même si elles vous y en trouver, commencez par revoir vos paramétrages anti duplication d'URLs. Toutefois il peut arriver que vous ne puissiez empêcher des URLs dupliquées d'apparaitre dans Google Outils pour les Webmasters.
Note : Ne paniquez pas lorsque vous verrez cette problématique apparaître comme un avertissement dans Google Outils pour les Webmasters. En effet pour les nouveaux sites Google rencontre souvent ce type de problèmes, mais généralement, et plus particulièrement pour les paramètres, il va apprendre qu'il ne s'agit pas d'une nouvelle page, et les avertissements disparaitront après quelques semaines... Il ne vous restera plus qu'a adresser les problèmes restants. Mais soyez conscient que c'est un sujet assez avancé. Pour plus d’informations lisez notre article sur ce sujet.
Il y a aussi d'autres façons de résoudre les problèmes d'URLs dupliquées dans Joomla, consultez article récent du Joomla Magazine.
Cet article est une traduction libre du tutoriel de Simon Kloostra : Avoid duplicate URL's