Luchar y protegerse contra el duplicate content

Definición de duplicate content

Se habla de duplicate content («contenido duplicado» en español) cuando se encuentra el mismo texto en dos o más páginas, ya sea en el mismo sitio o en dos sitios web distintos.

En caso de que se encuentre un mismo texto en varios sitios distintos, se trata a menudo de plagio, es decir, de robo de contenido.

Duplicate content y SEO

Evidentemente, el plagio está sancionado jurídicamente siempre que se puedan aportar pruebas de propiedad.

Del mismo modo, en aras de la calidad de los resultados naturales de búsqueda (SEO), los motores de búsqueda tratan de detectar los sitios que albergan contenido duplicado para sancionarlos con gran dureza.

Los sitios web que duplican contenido se arriesgan a:

  • El descenso en los resultados naturales de los motores (SEO). En otras palabras, el sitio copiador retrocede en los resultados de búsqueda.
  • La desaparición completa del sitio en las búsquedas naturales (SEO). En otras palabras, los motores de búsqueda dejan de referenciar el sitio.

Estos son algunos casos de contenido duplicado en el mismo sitio:

  • Un mismo contenido (texto, imágenes, enlaces...) propuesto por dos URL distintas de un mismo sitio web. Se encuentran casos de duplicate content, por ejemplo, cuando en un CMS (Content Management System) se crean dos páginas idénticas con una URL para cada una. Este caso de duplicate content se produce debido a un error humano o a un error técnico. Por supuesto, no es el caso más grave de contenido duplicado desde el punto de vista del SEO, salvo si tienes un número muy grande páginas duplicadas de esta forma.
  • Has reestructurado tu sitio recientemente y por ejemplo has cambiado su árbol de directorios y por tanto sus URL. Presta atención a que las antiguas URL y las nuevas URL no coexistan juntas y no surjan casos de contenido duplicado.

Estos son algunos casos de contenido duplicado en sitios distintos:

  • La descripción idéntica o demasiado cercana de un mismo artículo en sitios distintos de e-commerce.
  • Mucho más extendido como caso de contenido duplicado es la repetición de extractos de texto ya utilizados en otras páginas o de otros sitios web. Se encuentra este caso de duplicate content cuando los sitios que abordan un mismo tema utilizan el mismo proveedor de contenido. Este caso podría plantear problemas desde el punto de vista del SEO, pues te impide que te posiciones arriba en los resultados de búsqueda debido a que tu contenido no se considera original.
  • Se recuperan flujos RSS en formato XML y se exponen en sitios a través de la web.
  • En este caso, evidentemente, existe duplicate content voluntario, de modo que se habla claramente de copia y por tanto de plagio de contenido. Los motores de búsqueda dan prioridad a detectar este caso. Como es natural, los sitios que se hallan en este caso de contenido duplicado son los que sufrirán una mayor penalización de su SEO.

Ten en cuenta que esta lista no es exhaustiva, recoge los casos más extendidos en la web de duplicate content.

¿Cómo evitar el contenido duplicado?

Verificar sistemáticamente las páginas de tu sitio

Esto permite controlar los casos de duplicación de contenido involuntario que pueda generar tu CMS.

En caso de reestructuración del sitio, utilizar redirecciones 301 «Redirect Permanent»

Esto permite redirigir con eficacia a los internautas y los motores de búsqueda hacia las nuevas URL y de este modo eliminar cualquier problema de contenido duplicado.

Verificar con regularidad Google Webmaster Tools

Os indicará los casos de contenido duplicado detectados en tu sitio web.

Utilizar URL canónicas

Hay casos legítimos en los que varias URL albergan el mismo contenido. Por ejemplo, imagina una lista de productos en un sitio de e-commerce organizados por precio ascendente. Imagina luego la misma lista organizada por precio descendente. Se trata del mismo contenido, pero técnicamente quizá haya 2 URL diferentes. En este caso preciso, el desarrollador tiene la posibilidad de indicar a Google qué URL debe tomar como referencia en relación con otras.

Esto permite protegerse de forma muy simple contra el duplicate content dentro de un mismo sitio. En efecto, las URL canónicas permiten precisar cuáles son las páginas madre entre varias duplicadas o varias páginas muy cercanas en términos de contenido. De este modo, puedes proponer todo tu contenido a tus visitantes sin arriesgar no obstante que se penalice tu SEO. La etiqueta que ayuda a precisar una URL canónica es:

<link rel="canonical" href="url"/>

Basta con colocarla en el encabezado html de tu página, entre <head/> y </head/>.

Consulta el artículo dedicado a las URL canónicas para más información sobre este tema.

Para los sitios creados con tecnologías clave en mano, existen opciones para indicar las URL canónicas y por tanto protegerse contra el duplicate content.

Verificar si otras páginas han duplicado tu contenido

Puedes realizar comprobaciones manuales: para esto toma trozos de texto al azar y realiza búsquedas en Google. Si algún otro sitio ha retomado el extracto de texto, Google te lo reflejará en los resultados de búsqueda.

Tomar precauciones antes de comprar contenido a un tercero

Si compras contenido a un proveedor, asegúrate por contrato de que se trata de contenido original y exclusivo, de lo contrario te encontrarás con contenido duplicado. Si no es el caso, no lo compres y crea tú mismo tus contenidos.

Si tienes que comprar obligatoriamente contenido ya vendido a otros sitios, para evitar el duplicate content, vuelve a trabajar sobre estos textos para diferenciarlos de los de tus competidores. Las modificaciones que realices deberán diferenciar claramente tu contenido del de la competencia. Si solo cambias algunas palabras, se tratará entonces de contenido «reciclado»; lo que se considera también como duplicate content y por tanto penalizará tu SEO.

¿Cómo defender tus derechos de autor?

Google ofrece estas posibilidades para notificar un perjuicio de tus derechos de autor o para notificar una impugnación tras penalizaciones SEO que haya causado un caso de duplicate content.

Solicitar la revisión de tu sitio

Si tu sitio ya no se muestra en los resultados de búsqueda o si su SEO empeora, Google quizás haya considerado que estás ofreciendo contenido duplicado. En este caso tienes la posibilidad de solicitar a Google que revise tu sitio para tratar de regresar en los resultados de búsqueda.

Para esto puedes dirigirte a Google Webmaster Tool.

Notificar una impugnación

Tras una notificación de derechos de autor, ¿ha desaparecido tu sitio de los resultados de búsqueda? Puedes impugnar esta decisión dirigiéndote al siguiente enlace: http://support.google.com/legal

Notificar un perjuicio de tus derechos de autor

Tienes la posibilidad de presentar ante Google una reclamación por perjuicio de tus derechos de autor.

Sin embargo, no debes tomar a la ligera este proceso. En efecto, si realizas una falsa declaración, deberás pagar posibles daños e intereses al sitio notificado.

Para esto dirígete a http://support.google.com/legal y sigue las instrucciones.