Generar un sitemap para el posicionamiento natural

¿Qué es un sitemap?

Un sitemap es un archivo que contiene una lista enriquecida de URL internas de un sitio web. Este archivo está en formato XML. Permite proporcionar a los principales motores de búsqueda información sobre las URL de un sitio web que no podrían descubrir por sí mismos.

Para entender bien para qué sirve un sitemap, hay que entender la manera en la que funcionan los robots de indexación de los motores de búsqueda (llamados también web spiders, crawlers o Bots) como Google, Yahoo o Bing. Estas son sus acciones cuando analizan un sitio como www.misitio.com:

  • Comienzan por descargar y analizar el archivo http://www.monsitio.com/robots.txt (si existe). Consulta el artículo dedicado específicamente a los Robots.txt para más información.
  • Después descargan la raíz del sitio, es decir, la URL http://www.monsitio.com/.
  • Analizan el contenido de esta página y extraen en particular la lista de los enlaces internos que contiene.
  • Todos estos enlaces internos se descargan a su vez y se extraen sus enlaces internos.
  • De forma recursiva todos estos enlaces se descargan y analizan (si son nuevos), hasta que el robot no encuentra otros nuevos.

De este modo se puede comprobar lo siguiente: si una URL de un sitio web no es accesible por su raíz o de forma recursiva en sus descendientes, entonces un robot no la puede encontrar mágicamente. Por este motivo se crearon originalmente los sitemaps: para que el webmaster de un sitio pueda indicar a los robots URL que no podrían encontrar solos.

3 tipos de entradas en un sitemap: los enlaces, los vídeos y las imágenes

Un sitemap puede contener URL «clásicas» (HTML, PDF...), URL de imágenes e incluso URL de vídeos.

Las URL internas en un sitemap

Además de permitir la indexación de los enlaces de difícil acceso, el archivo sitemap permite enriquecer la lista de URL con metadatos como:

  • la fecha de la última modificación del recurso que corresponde a una URL;
  • la frecuencia estimada de modificación de este recurso;
  • la importancia relativa de esta URL en el sitio web.

Los motores de búsqueda utilizan la información contenida en los sitemap para optimizar el posicionamiento de tu sitio web, pero como siempre, resultan vagos sobre cómo utilizan exactamente los sitemaps y la información que poseen. En cualquier caso, desaconsejan «engañar» sobre estos valores (por ejemplo, declarando artificialmente en el sitemap una frecuencia de actualización que no se respeta).

Los vídeos en un sitemap

Generar y dominar un sitemap para los vídeos permite controlar la información que hay que transmitir a los motores de búsqueda y, sobre todo, asegurarse de que los motores de búsqueda puedan indexar la totalidad de los vídeos propuestos en tu sitio.

Esta es la información que deberían contener las entradas de sitemap para vídeos:

Etiqueta Importancia Descripción
<video:title> Obligatoria El título del vídeo
<video:description> Obligatoria Una descripción del vídeo
<video:player_loc> Obligatoria La URL de la página del vídeo
<video:thumbnail_loc> Obligatoria La URL de la viñeta

Con el fin de que el sitemap para vídeos contribuya por completo al posicionamiento natural de tus vídeos, evita:

  • Superar 50 000 líneas por sitemap. Si el límite se ve afectado, entonces obligatoriamente hay que generar varios archivos sitemap.
  • Bloquear los vídeos en el robots.txt.
  • Repartir los archivos de vídeo en varios repertorios distintos.

Un sitemap para las imágenes

Dominar un sitemap de imágenes permite aumentar la probabilidad de que tus imágenes se indexen y, por lo tanto, remonten en los resultados de búsqueda por imagen. El sitemap para las imágenes te permite:

  • proporcionar información adicional sobre tus imágenes;
  • la indexación de la totalidad de tus imágenes;
  • identificar las imágenes más importantes que deseas indexar;
  • indexar las imágenes que solo estarán accesibles por medio de formularios dinámicos.

Las entradas de imágenes de un sitemap deben indicar esta información para cada una de las imágenes que hay que indexar:

Etiqueta Importancia Descripción
<image:image> Obligatoria Etiqueta que introduce toda la información relativa a una sola imagen.
<image:loc> Obligatoria Esta etiqueta indica la URL de la imagen.
<image:capitation> Opcional Descripción de la imagen
<image:title> Opcional Título de la imagen
<image:license> Opcional URL que remite a la licencia de la imagen
<image:geo_location> Opcional Puedes indicar aquí la situation geográfica de la imagen.

Con el fin de que el sitemap para las imágenes contribuya por completo al posicionamiento natural de tus imágenes, evita:

  • Superar 50 000 líneas por sitemap. Si el límite se ve afectado, entonces no dudes en enviar varios sitemap para las imágenes.
  • Bloquear las imágenes en el robot.txt.
  • Repartir los archivos de imágenes en varios repertorios distintos.

Los sitemaps también poseen una segunda utilidad, y esta vez afecta a todas las URL internas de un sitio, no solo las de difícil acceso: el archivo sitemap permite enriquecer la lista de URL con los metadatos sobre estas URL, tales como:

  • la fecha de la última modificación del recurso que corresponde a una URL;
  • la frecuencia estimada de modificación de este recurso;
  • la importancia relativa de esta URL en el sitio web.

Los motores de búsqueda utilizan esta información para optimizar el posicionamiento de tu sitio web, pero como siempre, resultan vagos sur cómo utilizan exactamente esta información. En cualquier caso, desaconsejan «engañar» sobre estos valores (por ejemplo, declarando artificialmente una frecuencia de actualización que no se respeta).

¿Necesito un sitemap para mi sitio web?

Ahora la cuestión es saber si necesitas un sitemap para tu sitio. Tal vez tu asesor de SEO te lo ha recomendado vivamente. De hecho, para la mayor parte de los sitios web «simples», un sitemap no es absolutamente necesario. Te recomendamos no gastar tu energía en crear un buen sitemap en los casos siguientes:

  • Si todos los enlaces de tu sitio son accesibles por la raíz o todos sus descendientes (de forma recursiva). De hecho, ¡es el caso de la mayor parte de los sitios!
  • Si tienes relativamente pocos recursos técnicos para tu sitio web. Un buen sitemap debe estar bien hecho, respetar la norma XML y las especificaciones del sitemap, así como tener valores de metadatos precisos. De lo contrario, no sirve de nada. Existen herramientas para generarlo automáticamente, pero a menudo hace falta optimizarlo «a mano» o por programación (en particular para elegir bien los valores de metadatos).
  • Si tu sitio no posee contenido interesante desde el punto de vista del SEO, que se actualiza con mucha regularidad.

En los otros casos (en la práctica para sitios bastante sofisticados), un sitemap puede ser útil para la optimización del posicionamiento de tu sitio web.

¿Cómo generar un sitemap?

Hay 3 formas de generar un archivo sitemap:

  • Manualmente, creando un archivo XML. Este método por lo general se desaconseja, ¡salvo si realmente sabes lo que haces! Como mínimo, se recomienda utilizar un editor XML para crear este archivo.
  • Mediante desarrollo informático específico en tu sitio: este método será el más potente y se adaptará a todas las problemáticas de tus sitios, pero también es el más costoso en recursos. Presta atención al número máximo de URL en un archivo sitemap, a veces se debe poder segmentar en varios archivos.
  • Utilizando una herramienta de generación automática. Este método es tentador: ¡muy poco trabajo para un resultado profesional! Sin embargo, elige con atención una buena herramienta de generación. ¡Por ejemplo Yakaferci!


    Generar gratis un sitemap para tu web:
    Analizar mi página


¿Cómo informar a Google de tu sitemap?

Al contrario que con el archivo Robots.txt, no basta con colocar un sitemap en tu sitio para que un robot lo encuentre. En efecto, no hay acuerdo de denominación exacta sobre este archivo (puede tener varios, el archivo puede estar comprimido, etc.). En consecuencia, debes declararlo explícitamente a los motores de búsqueda que te interesan particularmente. En el caso de Google, por ejemplo, es necesario realizar esta declaración gracias a las webmaster tools.

Para saber más

Si este artículo te ha generado interés por informarte más sobre el tema de los Robots.txt, aquí encontrarás algunos enlaces útiles: