checklist seo

Évitez les URLs dupliquées

Tout comme la problématique sur les URLs avec ou sans www, toutes les sortes de contenus dupliqués peuvent, potentiellement être un problème pour votre positionnement dans les résultats des moteurs de recherche.
Vous devez vous assurer bien sûr, que le contenu de vos articles est unique et non copier d'autres sources ou réutilisé dans d'autres parties de votre site, mais vous devez aussi être sûr que la même page ne puisse être accessible sous différentes URLs.

Beaucoup de CMS open source ont souvent cette problématique et Joomla en fait partie. Même si vous avez activer la réécriture d'URLs dans la configuration de votre site Joomla, les Urls non réécrites existent toujours. En clair 2 URLs permettent d'accéder au même contenu, et souvent beaucoup plus que 2.

Les URLs dupliquées peuvent exister pour les raisons suivantes :

  • Des URLs avec ou sans www, tel que détaillé dans l'article précédent.
  • Des URLs de pages se terminant par index.html, index.php, etc, et qui montrent le même contenu que la page sans ce suffixe.
  • Des paramètres d'URLs tels que ..../page1?font-size=large
  • Des trailing slashes
  • Parfois des problèmes de lettres en capitales ou minuscules
  • Et pour Joomla : le même article accessible depuis différents éléments de menu
  • Des URLs non réécrites toujours accessibles, même si vous avez activé la réécriture d’URLs

Avoir des pages accessibles depuis de multiples URLs peut nuire à votre positionnement. Aussi est-il préférable de se prémunir contre cette problématique, ceci peut être fait de différentes façons. Même si certaines de ces solutions semblent uniques, vous pouvez les combiner pour complétement éradiquer votre site de ces URLs dupliquées :

1. Bien définir ses éléments de menu

L'une des causes courante d'URLs dupliquées provient du simple fait qu'un article Joomla est accessible depuis différents éléments de menu. C'est souvent le cas lorsqu' un article est accessible depuis un élément de menu de votre menu principal mais aussi depuis un élément de menu de votre menu en pied de page. Dans ce cas Joomla construit l'URL de la page à partir de l'élément de menu. Comparons maintenant 2 exemples :

  1. Si vous avez un menu nommé Produits, avec un sous élément de menu pour chacun de ces produits, l'URL de l'article Chaise sera /index.php/produits/chaise 
  2. Si ce même article est accessible directement depuis votre menu en pied de page sans que ce soit un sous élément de menu, l'URL sera /index.php/chaise

Mise à part des éléments comme le fil d'ariane ou l'assignement de certains modules, ces pages sont identiques, et rentrent complètement dans la problématique des URLs dupliquées. Ce qui provient en partie de la façon dont Joomla fonctionne, mais il y a des solutions dans la plupart des cas :

  • Parfois le menu principal est répété en pied de page. Si c'est le cas et à partir du moment ou il exactement identique, il vous suffit simplement de le publier aussi dans la position pied de page de votre template, mais surtout ne récréé pas un nouveau menu avec des liens identiques.
  • Il est assez courant d'avoir des éléments de menu de différents menu que l'on souhaite voir pointer vers le même article. Dans ce cas, ne recréé pas un nouveau lien de menu de type "article" mais un lien de menu de type  "Alias de menu" (rubrique lien divers). Ce qui aura pour effet de reprendre l'URL originale du sous élément de menu vers lequel pointe cet alias, ainsi il n'y aura pas de nouvelles URLs de créées!

2. Définir la balise canonical pour la bonne page

Si vous définissez la balise canonical pour la bonne page, vos URLs non réécrites ne seront pas indexées. Il y a différentes façons d'y parvenir, mais pour ce faire vous devez être un utilisateur Joomla expérimenté. En effet si vous ne définissez pas de façon correcte cette balise, vous pourriez produire l'effet inverse de celui escompté.
La solution la plus simple pour la mette en place est probablement d'utiliser une extension  Joomla. La plus part des extensions SEF vous proposeront ce type de paramétrage.

Si vous mettez en place cette balise correctement, toutes les pages dupliquées de Joomla contiendront cette balise dans le code <head> de leur page. Un exemple avec la page ci-dessous qui peut être consultée par 2 URLs différentes:

La première URL est actuellement redirigée, mais si ce n' était pas le cas, en insérant l'URL canonical, Google comprendra qu'il s'agit de la même page que l'URL réécrite :

<link href="/Checklist/avoid-duplicate-url-s" rel="canonical"/>

En utilisant cette technique, vous indiquerez à Google de ne pas indexer le Urls dupliquées, même si elles restent toujours accessibles.

La seule option que vous pouvez définir dans Joomla se trouve dans les paramètres du plugin System - SEF. Il vous permet de définir le domaine du site. Cependant cela ne vous sera utile uniquement si vous définissez votre site comme accessible depuis de multiples domaines, en vous permetant de définir le domaine canonique.

sytem sef plugin canonical

Vous devez être conscient qu'en ce moment (Joomla 3.2, problème réglé depuis avec Joomla 3.2.1) il peut y avoir des problèmes avec la façon dont les URLs canonicals sont traitées. Vous aurez peut être besoin d'une extension pour les définir tel que vous le souhaitez.

3. Créer des redirections 301

Utiliser des redirections 301 revient à spécifier que l'adresse d'une page a été changée de façon permanente et renvoient les internautes ou moteurs de recherche vers sa nouvelle adresse :

http://joomla-seo.net/index.php?option=com_content&Itemid=125&catid=15&id=18&lang=en&view=article

est renvoyée vers :

http://joomla-seo.net/Checklist/avoid-duplicate-url-s

Vous pouvez définir des redirections 301 soit dans votre fichier .htaccess, ou en utilisant une extension telle que RedJ, une extension très simple pour créer ce type de redirection.

Plus d'informations sur les redirections 301 sont disponibles dans l'article rediriger ses vieilles URLs.

4. Définir des régles dans son .htaccess

En utilisant le fichier .htaccess de Joomla vous pouvez résoudre un nombre important du problèmes d' URLs dupliquées (à condition que la réécriture d'URL soit activée). Nous avons déjà vu comment rediriger ses URLs avec www vers le sans www, mais vous pouvez aussi éliminer les trailing slashes :

RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]

Testez si le trailing slash a bien disparu et que votre site soit toujours fonctionnel. Soyez toujours prudent avec toutes les modifications que vous apporter au .htaccess !

Des problèmes similaires peuvent se poser du fait de certains paramètres, comme la mise en place de taille de police, peuvent conduire Google peut à penser que 2 pages existent :

  • /contact.php
  • /contact.php?font-size=larger

5. Utiliser le fichier robots.txt

Vous pouvez modifier votre fichier robots.txt de telle façon que toutes les URLs contenant une chaîne de requête, c'est à dire un ?, ne soient pas indexées, consulter l'article sur le robots.txt pour le code à insérer. Cette solution résout les problèmes des URLs dupliquées dus aux URLs non réécrites, mais aussi dus aux chaînes de requête, tel que :

  • /contact.php
  • /contact.php?font-size=larger

6. Utiliser une extension

Pour de petits sites, ces problèmes peuvent être facilement résolus en configurant son .hatccess ou son robots.txt et en utilisant une petite extension pour créer les redirections 301, mais pour des sites plus gros utiliser une extension SEF est probablement plus efficace.
Comme cela prends du temps à s'habituer à ce type d'extensions, tester vous sur un site de moindre importance. Si elle est bien utilisée elle éradiquera tous les problèmes d'URLs dupliquées de votre site. Mais si elle est mal utilisée elle pourrait produire l'effet inverse.

Voici quelques extensions SEF bien connues :

Consultez la section extension de ce site http://joomlaseo.com/SEO-extensions/ pour plus d'informations sur ces extensions et quelques autres.

7. Google Outils pour les Webmasters

Google Outils pour les Webmasters est une autre solution pour se débarrasser des URLs dupliquées. Mais de préférence, vous devriez utiliser les techniques listées ci-dessus, pour vous prémunir du listing des URLs dupliquées dans Outils pour les Webmasters, et même si elles vous y en trouver, commencez par revoir vos paramétrages anti duplication d'URLs. Toutefois il peut arriver que vous ne puissiez empêcher des URLs dupliquées d'apparaitre dans Google Outils pour les Webmasters.

Note : Ne paniquez pas lorsque vous verrez cette problématique apparaître comme un avertissement dans Google Outils pour les Webmasters. En effet pour les nouveaux sites Google rencontre souvent ce type de problèmes, mais généralement, et plus particulièrement pour les paramètres, il va apprendre qu'il ne s'agit pas d'une nouvelle page, et les avertissements disparaitront après quelques semaines... Il ne vous restera plus qu'a adresser les problèmes restants. Mais soyez conscient que c'est un sujet assez avancé. Pour plus d’informations lisez notre article sur ce sujet.

 Il y a aussi d'autres façons de résoudre les problèmes d'URLs dupliquées dans Joomla, consultez article récent du Joomla Magazine.

Cet article est une traduction libre du tutoriel de Simon Kloostra : Avoid duplicate URL's  

Ils nous ont fait confiance

Universités & organismes de recherche

L' INSERM - unité U999, Université Paris Sud - Centre Chirurgical Marie Lannelongue

The Center for Groundwater Studies - Australie

L 'ENSAE : École Nationale de la statistique et de l'administration

La Maison des Sciences de l'Homme Paris Nord , UMS de l'université Paris 8, de l'université Paris 13 et du CNRS

L' Institut Supérieur de Développement - ISD Flaubert

Monpellier RIO imaging (MRI), plate - Forme Technologique (PFT), labellisée IBiSA.

CNRS - INEE  Le Laboratoire d'Excellence Dispositif de Recherche Interdisciplinaire sur les Interactions Hommes-Milieux (LabEx DRIIHM)

Organismes publics

Ministère de la défense : État Major de la 3ème Brigade Mécanisée

La mairie de la ville de Marly le Roi

La mairie de la ville de Breuillet

La mairie de la ville de Thuir

L' Agence Locale de l'Energie de la métropole marseillaise

L' Institut de Formation en Masso-kinésithérapie de Montpellier - Centre Hospitalier Universitaire de Bellevue

Le Centre de Gestion de la fonction Publique Territoriale des Alpes de Haute Provence

La Capitelle - couveuse d'entreprises du Gard

Le Centre Social Intercommunal de Saint Quentin de la Poterie

Le collège & lycée Saint Charles

Le lycée Philippe Lamour

Le centre François Baclesse: Centre de Lutte Contre le Cancer (CLCC)

L' Etablissement Régional de Formations des Professions Paramédicale du Groupement d'Intérêt Public des Etablissement de Santé d'Avignon et du pays de Vaucluse

Entreprises

Astrium une filiale EADS No 1 européen et No 3 mondial de l'industrie spatiale

Messer France

Photonlines

Shânti Gestion

App-Line

Vincent et Mireille

Axiom Information

Galerie Art City

Le Château de Boisson

LM Control

Vagabonde International

Photonlines Energy

la Pisciculture la Croisière

FHSolution

NaturEditions

Etudions à l'étranger

E.P.A.

Microeconomix

Alatak

Jade Black Design

Une bague une destinée

Schmulb

Espace revêtements

Partenaire de réussite

Stylitek

Fun-Kart

The Crew Coach

Sanitval

Ateliers d'écriture de Virginie Lou

cam4you

SDB+

Armelle Bongrain - architecte d'intérieur

ECIM

Riveria Expat Consultants

Florence Thorez - Diététicienne Nutritionniste

Le Séchoir

Le Moulin de Bouydou

L' Espace de Formation Clinique et Psychanalytique

Cours de musique à Montpellier

Leads Planet

Agerix

Etudions à l'étranger

Biopreserv

Aloes RED

InfoTour

EverNew

Synalabs

Bureau d'Etudes Arlaud

Stage de musique été

Fermetures Neuvillaises

Linguapolis

Weblligence

ASD Protect

Véronique Crépaux

Françoise Léon

Inovtolerie

BlueSafe

Viasocial

Repco Marine

King Jouet

Dr Abbas

ER3M

Cryo'net

Vectoring Talents

Desir d'écrire

Dr Girardin

Installation yperreault

Viaortho

Viadentiste

Alice Sweet Home

Cannes property services

La méthode Silva

Les outils du mieux être

Pinceaux et Camaïeux

Viacoach

ASH Conciergerie

MC Coaching Pro

Argos communication 

Cpsforma

Hervé Graille - Architecte 

Adrien Baguet - Architecte

ONG / Associations

UNESCO: International Music Council

L' Association de Recherche en Soins Infirmiers

L' Union Internationale Contre la Tuberculose et les maladies respiratoires

Le Centre National des Risques Industriels

L' Institut International des Hautes Études en Psychanalyse

SurdiFrance : Association nationale de malentendants

La fondation Internationale de l'Hôpital Albert ScMhweitzer à Lambaréné

La Maison des Professions Libérales Ile de France

Le Conseil National de l' Enseignement Agricole Privé

La ligue Dauphiné Savoie de tennis

Le Conseil Permanent Régional des Associations d’Environnement

Le Syndicat des Podologues d'Île de France

La compagnie aux grands pieds

L'Espace de l'Ouest Lyonnais

Les Courants d'Airs

Nîmes Volley Ball

Le Club photo de Saint-Laurent-du-Var 

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour notamment réaliser des statistiques de visites