La URL canónica (etiqueta «link rel=canonical») para evitar contenido duplicado

¿Qué es una etiqueta link rel=canonical?

La etiqueta link rel=canonical es una etiqueta HTML que permite indicar a los motores de búsqueda la URL canónica en una página determinada. En el siguiente apartado se explica qué es una URL canónica.

Esta etiqueta debe colocarse en la zona de un archivo HTML:


...
<link rel="canonical" href="http://www.yakaferci.es/" />
...
</head>

En inglés varias terminologías designan la etiqueta link canonical: «canonical tag», «rel=canonical», «rel canonical tag», «canonical URL tag», «link canonical tag».

En español encontramos «etiqueta link rel=canonical», «etiqueta canónica», «URL canónica».

¿Qué es una URL canónica?

Una URL canónica representa la versión preferida de un conjunto de páginas de contenido similar que pueden crear referencias de contenidos duplicados (duplicate content). El webmaster del sitio en cuestión debe elegir con atención la URL canónica.

La inclusión de la etiqueta canónica permite a los propietarios de los sitios identificar los conjuntos de contenido idéntico e indicar a Google: «Entre todas estas páginas cuyo contenido es muy similar, ten en cuenta en los resultados de búsqueda solamente esta URL canónica».

En la práctica, las URL cuyo código HTML indica otra URL canónica mediante esta etiqueta nunca aparecerán en los resultados de búsqueda de Google. La URL canónica es la que siempre se tendrá en cuenta en los motores de búsqueda.

Por lo tanto, la URL canónica permite evitar los casos de contenidos duplicados (duplicate content).

Consulta el artículo dedicado al duplicate content para más información sobre este tema.

Consulta el artículo dedicado a las URL (Uniform Resource Locator) para más información sobre este tema.

Objetivos de la etiqueta «link rel=canonical»

El uso del elemento «link rel=canonical» tiene 3 objetivos que son muy importantes para la optimización del SEO:

  • La etiqueta canónica ayuda a los motores de búsqueda a identificar fácil y rápidamente qué página incluir o excluir de su indexación y ante todo qué versión de URL volver a subir en las solicitudes de búsqueda.
  • La etiqueta «link rel=canonical» permite evitar posibles penalizaciones SEO ligadas a contenidos duplicados que el CMS genera automáticamente con frecuencia.
  • La etiqueta «link rel=canonical» permite aumentar la popularidad de un contenido al almacenar en una única URL los backlinks. Puede suceder que varios backlinks apunten hacia un mismo contenido, pero que los enlaces que permiten acceder al contenido varíen, por ejemplo, en función de los parámetros de clasificación que contengan.

¿Cómo colocar la etiqueta «link rel=canonical»?

Etiquetado de las páginas con «link rel=canonical»

Entre dos o más páginas muy similares, se recomienda indicar tu favorita, es decir, la que quieres que los motores de búsqueda analicen e indexen.

Para ello puedes utilizar el elemento «link rel=canonical». En las páginas similares o secundarias, hay que añadir un elemento «link rel=canonical» en el de la página.


...
<link rel="canonical" href="http://www.yakaferci.es/" />
...
</head>

Un sitemap para indicar las URL favoritas que llevan la etiqueta «link rel=canonical»

Para acelerar la exploración de tu sitio por los motores de búsqueda y asegurarte de que tus URL canónicas se tendrán en cuenta adecuadamente, a menudo se recomienda crear un sitemap. Selecciona tus URL canónicas para cada una de tus páginas e indica en el sitemap que te sometes a los motores de búsqueda.

Evidentemente, las URL secundarias no deberían enumerarse en el sitemap.

¿Cómo saber si hay que utilizar la etiqueta link canonical?

Se recomienda utilizar la etiqueta link canonical en caso de que tu sitio contenga dos o más URL diferentes con un contenido idéntico.

Si el contenido de dos páginas es bastante cercano pero no exactamente igual, entonces sería más aconsejable desde el punto de vista de la oferta y desde el punto de vista del SEO volver a trabajar las páginas con el fin de diferenciarlas.

Para saber si dos o más páginas son similares, existen dos métodos de verificación muy simples:

  • Situar las dos páginas una junto a otra y revisar si la mayoría de las frases se encuentran en ambas páginas. De ser así, entonces tienes dos contenidos duplicados.
  • Analizar tus páginas «sospechosas» con nuestra herramienta de Yakaferci. En el capítulo contenido / densidad de palabras clave, comprueba si tienes la misma lista de palabras con las mismas variantes (lematización) y la misma presencia.

Casos de uso de la etiqueta link canonical:

La etiqueta link canonical es una solución rápida y sencilla que permite resolver los casos de contenidos duplicados comprobados en tu sitio.

Caso 1: URL dinámicas generadas por la función de clasificación del producto

Para ilustrar el concepto de URL canónica, imagina que la URL /tous-lesproduits.html de un sitio contiene la lista completa de todos los productos de un sitio de e-commerce, por orden alfabético. Y que si el usuario pincha sobre la clasificación por orden decreciente, la URL utilizada por el desarrollador del sitio es /tous-lesproduits.html?tri=Z-A. En ese caso, las 2 URL contienen el mismo contenido pero en distintos órdenes. Es un caso típico en el que se recomienda indicar a Google una «URL canónica» para que se indexe solamente ese sitio:

Link canonical

Caso 2: CMS que generan URL diferentes

Tu sistema de gestión del sitio (CMS) genera URL diferentes cada vez que colocas un producto bajo varias categorías o subcategorías.

Una vez más, para evitar problemas de contenidos duplicados, se recomienda definir una URL favorita.

URL con contenido idéntico

Solución: definir una URL favorita

URL con contenido idéntico Solución: definir una URL favorita
http://www.misitio.com/red-category/01-product http://www.misitio.com/new-product/01-product
http://www.misitio.com/new-product/01-product
http://www.misitio.com/best-sales/01-product

¿Qué errores hay que evitar?

Aquí encontrarás una lista no exhaustiva de errores de colocación de la etiqueta «link rel=canonical» que se pueden comprobar en los sitios web:

  • La etiqueta «canonical» situada en el cuerpo y no en el encabezado del código HTML de las páginas del sitio (página canónica y páginas en duplicate content)
  • Para que la regla que quieres implantar se tenga en cuenta rápida y eficazmente, hay que colocar la etiqueta «link rel=canonical» en el encabezado. De esta forma, los motores estarán actualizados desde que se carga la página.
  • La escritura de las URL (relativas o absolutas) en la etiqueta link canonical: Se recomienda utilizar rutas de acceso absolutas (http://www.misitio.com/01-produit) en lugar de rutas de acceso relativas (/01-producto). Esto permite indicar con precisión las páginas implicadas en la regla y evita que se confundan ciertas páginas.
  • Introducir la etiqueta canonical en los contenidos paginados si el contenido de las páginas es diferente. Si propones 200 artículos diferentes en una determinada categoría, y solo presentas 50 artículos por página, estás empleando a menudo un sistema de paginación (página 2, página 3, página 4) para presentar todos tus artículos. No hace falta poner la etiqueta link reel=canonical para indicar que la página 1 es tu favorita, puesto que las demás páginas (página 2, página 3 y página 4) que contienen artículos distintos no se indexarán, en perjuicio del SEO.
  • Especificar distintas URL canónicas para la misma página. Esto crea una confusión entre reglas contradictorias. Una misma página solo se puede designar canónica una única vez.
  • La URL canónica devuelve un error 404. Si la URL canónica devuelve un error 404, y las páginas secundarias tienen «prohibida» la indexación mediante la etiqueta link rel=canonical, entonces tu contenido desaparecerá definitivamente de los resultados de búsqueda.
  • La página favorita no debe contener etiquetas meta robots «noindex» u otra prohibida en el archivo robots.txt. La etiqueta robots.txt tiene prioridad sobre la etiqueta meta robots «noindex», que a su vez tiene prioridad sobre la etiqueta link rel=canonical. Si robots.txt o la etiqueta meta robots «noindex» prohíben que una página canónica se indexe y al mismo tiempo todas las páginas secundarias (a la página canónica) a su vez están prohibidas por la etiqueta link rel=canonical, entonces el 100 % del contenido se retirará del índice de los motores de búsqueda de forma definitiva.
  • La página favorita y las páginas secundarias no deben contener otras etiquetas link canonical. Varias páginas contienen etiquetas link canonical que devuelven mensajes contradictorios, lo que no favorece a los motores de búsqueda y anularía el efecto de estas etiquetas canónicas.
  • La página incorrecta marcada como si fuera la página canónica.

Diferencia entre la URL canónica y una redirección 301

Desde el punto de vista del SEO, la URL canónica y la redirección 301 devuelven un mensaje muy cercano a los motores de búsqueda: «Mi sitio contiene varias páginas que recogen contenidos similares y que se pueden reagrupar en una sola».

Aunque existen diferencias importantes entre una URL canónica y una redirección 301:

La redirección 301 devuelve el 100 % del tráfico que proviene de los internautas y de los motores hacia la URL única, mientras que la URL canónica se destina únicamente a los motores. Las URL secundarias son útiles para el funcionamiento del sitio para el visitante (por ejemplo una clasificación), pero no para los motores de búsqueda.

Consulta el artículo dedicado a las Redirecciones 301 para más información sobre este tema.