Lematización y stemming para el SEO

Una de las tareas esenciales de los motores de búsqueda sofisticados como Google es analizar los textos que encuentran en Internet y comprender lo mejor posible su contenido. Para realizar con eficacia este trabajo, los motores de búsqueda necesitan reagrupar las palabras «cercanas». Este trabajo se llama lematización (en inglés: lemmatization).

La lematización vs el stemming

La lematización designa el análisis léxico de un texto con el fin de reagrupar las palabras reales de una misma familia. Por lo tanto, se reducen a una única entidad llamada «lema» o «forma canónica» las palabras de una misma familia.

De este modo, la lematización consiste en reagrupar juntas las distintas formas de una palabra única.

La lematización reagrupa las distintas formas que puede adoptar una palabra: el plural, el verbo en infinitivo, el verbo conjugado en todos los tiempos, el nombre, etc.

El stemming designa el análisis semántico de las palabras con el fin de identificar y de reagrupar las distintas formas de una misma palabra en torno a una raíz (llamada «stem» en inglés, que proviene de «stemma» en griego).

La raíz de una palabra (o stemma) se identifica mediante la supresión del prefijo y/o del sufijo de una palabra.

Un punto diferenciador importante entre la lematización y el stemming: un lema es una palabra real de la lengua analizada, mientras que por lo general la raíz no es una palabra real (pues se basa en la proximidad semántica).

Aquí se indica un ejemplo de lematización y de stemming:

Lema Palabra
ser ser
eres
será
fue
Raíz Palabra
investig investigar
investigamos
investigadores
investigadora

Observa que se pueden encontrar casos en los que la raíz de una palabra es una palabra real. Por ejemplo: las palabras «arboleda» y «árbol» tienen como raíz «árbol», que también es una palabra real.

La lematización aplicada al SEO

En el marco de la optimización SEO, nos vamos a interesar por el lema (la lematización) puesto que trabaja con palabras reales que se pueden buscar en los motores de búsqueda.

La lematización para los motores de búsqueda

Cuando un motor de búsqueda analiza tu página web, busca las palabras que tienen la misma raíz y las reagrupa con el fin de identificar el tema principal de tu página.

Por tanto, el motor de búsqueda realiza un trabajo de identificación y de extracción de las palabras que tienen el mismo lema en un determinado texto.

De este modo, será capaz de reagrupar todas estas variantes en torno a un lema principal.

Ejemplo:

Al analizar nuestra página http://www.yakaferci.com/mot-cle/, esto es lo que la lematización puede mostrarnos para la palabra «Analizar».

Lema principal seleccionado Variantes de palabras detectadas
Analizar analizar
analizan
analiza

Gracias a la lematización, los robots considerarán aquí «analizar» como palabra clave principal, pero también tendrán en cuenta las demás variantes en la evaluación de la densidad de las palabras clave de la página arrastrada.

Por lo tanto, la lematización permite establecer de manera más precisa el contenido global de una página.

La lematización aplicada a la optimización de un contenido

Aparte de la elaboración de tu estrategia de palabras clave y aparte de la redacción de tu contenido, tienes que realizar el trabajo inverso al del motor de búsqueda.

Hay que comenzar por identificar la palabra clave principal para luego buscar todas sus posibles flexiones. A continuación colocarás estas variantes en zonas estratégicas de tu página.

La lematización utilizada en el SEO consiste en aumentar la densidad de tu palabra clave objetivo empleando un máximo de variantes de esta última gracias sobre todo a los prefijos y a los sufijos. Enriqueces tu contenido si eres menos repetitivo con una determinada palabra.

La lematización también permite, gracias a todas las flexiones posibles, aumentar el número de solicitudes diferentes por aquellas con las que los internautas te podrán encontrar.

Puesto que cada palabra tiene una raíz y unas formas flexionadas, es necesario identificarlas para una optimización SEO avanzada de las palabras clave de tus páginas.

La lematización también puede ser útil para evaluar la calidad de los backlinks de un determinado sitio, ya que permite variar el texto del backlink al optimizar la palabra clave objetivo.

Herramienta de lematización para optimizar el SEO

Yakaferci ha enriquecido su herramienta de análisis de la densidad de palabras clave al integrar la lematización para permitir que analices el contenido de tu página de forma precisa.


La lematización es accesible a todos gracias a Yakaferci, solo tienes que iniciar aquí el análisis de una página:
Analizar mi página


Aquí se muestra un ejemplo de resultado:

La relación sobre la densidad de las palabras clave que integran la lematización te indica:

  • La palabra principal que corresponde al lema de la familia de palabras analizadas.
  • Las variantes de la palabra principal (lema) detectadas en la página analizada (con su número de apariciones entre paréntesis).
  • El peso de la palabra (lema) calculado en función de la aparición y de la posición en la página (ponderación).
  • El número de apariciones indica el número de repetición global de todas las palabras con el mismo lema en la página.
  • Las posiciones indican la colocación de las palabras clave en las etiquetas HTML de la página analizada.
  • Acción: permite ver las palabras elegidas en el código HTML de la página.