¿Google utiliza el análisis de opiniones para clasificar las páginas web?

¿Es cierto que Google utiliza el análisis de sentimientos para clasificar las páginas web? Estos son los hechos

Muchos SEO’s creen que el sentimiento de una página web puede influir en si Google clasifica una página.

Si todas las páginas clasificadas en las páginas de resultados del motor de búsqueda (SERP) tienen un sentimiento positivo, creen que su página no podrá clasificarse si contiene sentimientos negativos.

La evidencia y los hechos están ahí para mostrar dónde se ha centrado la investigación de Google en términos de análisis de sentimientos.

Le pregunté a Bill Slawski (@bill_slawski), un experto en patentes relacionadas con Google, qué pensaba sobre la teoría SEO de que Google utiliza el análisis de sentimientos para clasificar las páginas web.

“El sentimiento es como un sabor, como vainilla o chocolate. No refleja la posible ganancia de información que podría aportar un artículo.

La ganancia de información se puede entender mediante el procesamiento de PNL para extraer entidades y conocimiento sobre ellas, y eso puede conducir a una determinación de la ganancia de información.

El sentimiento es un valor que no necesariamente refleja la cantidad de información que un artículo puede aportar a un tema.

El sentimiento positivo o negativo no es un reflejo de cuánto conocimiento está presente y agregado a un tema”.

Bill afirmó que Google tiende a mostrar una variedad de opiniones para consultas relacionadas con la revisión.

“No creo que Google favorezca un sentimiento sobre otro. Eso huele a mostrar un sesgo potencial sobre un tema.

Esperaría que Google quisiera cierta cantidad de diversidad en lo que respecta al sentimiento, por lo que si consideraran la clasificación basada en él, no mostrarían todo lo negativo o positivo”.

Bill hace un excelente comentario sobre la falta de utilidad si los resultados de búsqueda de Google introducen un sesgo de opinión.

Algunos SEO creen que si todos los resultados de búsqueda tienen un sentimiento positivo, eso es un reflejo de lo que buscan los buscadores. Esa es una correlación ingenua.

Existen muchos factores de clasificación conocidos, como los enlaces, que pueden explicar esas clasificaciones. Hay otros factores, como los usuarios que desean ver sitios específicos para consultas específicas.

Simplemente aislar un factor y decir: “Ajá, todos los sitios tienen esto, así que esta es la razón por la que está en el ranking” es ingenuo, es elegir lo que quieres ver.

Por ejemplo, el mismo SEO puede mirar esos resultados de búsqueda y ver que todos usan la misma marca de plugin de SEO.

¿Eso significa que el complemento de SEO es la razón por la que esos sitios se clasifican? La respuesta es NO.

Del mismo modo, el sentimiento expresado en los resultados de búsqueda no refleja necesariamente lo que el buscador está buscando.

Es por eso que digo que es ingenuo mirar un factor como el sentimiento y decir que esa es la razón por la que un sitio está en el ranking.

El hecho de que vea una correlación no significa que sea la razón por la que un sitio está en el ranking.

¿Google utiliza el análisis de sentimientos para la clasificación?

Google ha estado en gran medida en silencio sobre el análisis de sentimientos desde 2018.

En julio de 2018, alguien en Twitter preguntó:

“… parece que su algoritmo de búsqueda reconoce y tiene en cuenta el sentimiento. ¿Hay un operador de búsqueda de sentimientos?

Danny Sullivan respondió:

“No reconoce el sentimiento. Por lo tanto, no hay operador para eso “.

Danny dejó en claro que el algoritmo de búsqueda de Google no reconoce el sentimiento.

A principios de ese año, Danny publicó un anuncio oficial de Google sobre fragmentos destacados donde mencionó el sentimiento.

Pero el contexto del sentimiento era que para algunas consultas puede haber una diversidad de opiniones y, debido a eso, Google podría mostrar dos fragmentos destacados, uno positivo y otro negativo.

“… las personas que buscan” son reptiles buenas mascotas “deben obtener el mismo fragmento destacado que” son reptiles malas mascotas “, ya que buscan la misma información: ¿cómo los reptiles califican como mascotas?

Sin embargo, los fragmentos destacados que servimos se contradicen entre sí.

Una página que argumenta que los reptiles son buenas mascotas parece ser la mejor opción para las personas que buscan que sean buenos.

Del mismo modo, una página que argumenta que los reptiles son malas mascotas parece ser la mejor opción para las personas que buscan que sean malas.

Estamos explorando soluciones a este desafío, incluyendo mostrar múltiples respuestas”.

El punto de la sección anterior es que están explorando mostrando múltiples respuestas.

Desde 2018, Google ha dejado de mostrar fragmentos destacados para consultas vagas como “¿los reptiles son buenas mascotas?” y alentando a los usuarios a profundizar y elegir un reptil más específico.

Danny escribió:

“A menudo, los editores ofrecen perspectivas diversas legítimas, y queremos ofrecer a los usuarios visibilidad y acceso a esas perspectivas desde múltiples fuentes”, me dijo Matthew Gray, el ingeniero de software que dirige el equipo de fragmentos destacado.

Esas declaraciones contradicen directamente la idea de SEO de que si el sentimiento en los SERPs se inclina en una dirección, su sitio debe inclinarse en la misma dirección para clasificar.

Por el contrario, Google afirma que quieren mostrar diversidad de opiniones.

Aspectos positivos y negativos en las revisiones

Un trabajo de investigación de Google titulado, Modelos estructurados para análisis de sentimiento fino a grueso (PDF 2007) establece que un “sistema de respuesta a preguntas” requeriría un análisis de sentimiento a nivel de párrafo.

Un sistema que resume las revisiones necesitaría entender la opinión positiva o negativa a nivel de oración o frase.

Esto a veces se conoce como minería de opinión. El objetivo de este tipo de análisis es entender la opinión.

Así es como el trabajo de investigación explica la importancia del análisis de sentimientos:

“La capacidad de clasificar el sentimiento en múltiples niveles es importante ya que las diferentes aplicaciones tienen diferentes necesidades.

Por ejemplo, un sistema de resumen para revisiones de productos puede requerir una clasificación de polaridad a nivel de oración o frase; un sistema de respuesta a preguntas probablemente requeriría el sentimiento de párrafos.

Y un sistema que determina qué artículos de una fuente de noticias en línea son de naturaleza editorial requeriría un análisis a nivel de documento”.

El documento describe además cómo es útil el análisis de sentimientos:

“Análisis y extracción de relaciones (Miller et al., 2000), etiquetado de entidades y extracción de relaciones (Roth y Yih, 2004) y etiquetado y fragmentación de parte del discurso (Sutton et al., 2004).

Un trabajo interesante sobre el análisis de sentimientos es el de Popescu y Etzioni (2005) que intenta clasificar el sentimiento de las frases con respecto a las posibles características del producto”.

Lo que destaca de esa investigación es que se trata estrictamente de comprender el sentimiento del texto.

No hay contexto para usarlo para mostrar resultados de búsqueda sesgados hacia el sentimiento en la consulta de búsqueda de un usuario.

El contexto no se trata de clasificar el texto de acuerdo con el sentimiento.

Sin embargo, a pesar de que el contexto no se trata de la clasificación debido al sentimiento, algunos SEO citarán este tipo de investigación y luego agregarán que se está utilizando para la clasificación.

Y eso está mal porque el contexto de este y otros trabajos de investigación consiste consistentemente en comprender el texto, mucho más allá del contexto de clasificación de ese texto.

El análisis de sentimientos abarca más que positivo y negativo

Otro artículo de investigación, What’s Great and What’s Not: Aprendiendo a clasificar el alcance de la negación para un mejor análisis de sentimientos (PDF 2010) presenta una forma de comprender el sentimiento de las revisiones de productos.

El alcance de la investigación es encontrar una mejor manera de lidiar con la ambigüedad en la forma en que se expresan las ideas.

Ejemplos de este tipo de frases de negación lingüística son:

  • “Dada la mala reputación del fabricante, esperaba estar decepcionado con el dispositivo. Este no era el caso.”
  • “No se olvide de pedir su delicioso pan de ajo”.
  • “¿Por qué no podrían incluir un altavoz decente en este teléfono?”

Los ejemplos anteriores muestran cómo este trabajo de investigación se enfoca en comprender lo que los humanos quieren decir cuando estructuran su discurso de cierta manera.

Este es un ejemplo de cómo el análisis de sentimientos es algo más que sentimientos positivos y negativos.

Realmente se trata del significado de palabras, frases, párrafos y documentos.

El artículo comienza declarando la utilidad del análisis de sentimientos en varios escenarios, incluida la respuesta a preguntas:

“La detección automática del alcance de la negación lingüística es un problema que se encuentra en una amplia variedad de tareas de comprensión de documentos, que incluyen, entre otras, la extracción de datos médicos, la extracción de hechos o relaciones generales, la respuesta a preguntas y el análisis de sentimientos”.

¿Cómo clasificaría con precisión este tipo de oraciones ayudaría a un motor de búsqueda a responder preguntas?

Un motor de búsqueda no puede responder con precisión una pregunta sin comprender las páginas web que desea clasificar.

No se trata de usar esos datos como factores de clasificación. Se trata de utilizar esos datos para comprender las páginas para que luego puedan clasificarse según los criterios de clasificación.

Una forma de ver el análisis de sentimientos es considerarlo como la obtención de páginas web candidatas para la clasificación. Un motor de búsqueda no puede seleccionar un candidato si no puede entender la página web.

Una vez que un motor de búsqueda puede entender una página web, puede aplicar los criterios de clasificación en las páginas que probablemente respondan la pregunta.

Esto es especialmente importante para las consultas de búsqueda que son ambiguas debido a cosas como la negación lingüística, como se describe en el trabajo de investigación anterior.

Si Google utiliza el análisis de opinión, una página web no se clasifica debido al análisis de opinión. El análisis de sentimientos ayuda a que una página web se entienda para que pueda clasificarse.

Google no puede clasificar lo que no puede entender. Google no puede responder una pregunta que no puede entender.

Más investigación de análisis de sentimientos

SUIT: un modelo de tema basado en elementos de usuario supervisado para el análisis de sentimientos (PDF 2014)

Este artículo de investigación estudia cómo entender mejor lo que los usuarios quieren decir cuando dejan comentarios en línea en sitios web, foros, microblogs, etc.

Así es como describe el problema que se está resolviendo:

“… la mayoría de los métodos de temas existentes solo modelan el texto de opinión, pero no consideran al usuario, quien expresa la opinión, y el elemento sobre el que se expresa la opinión.

Dado que diferentes usuarios pueden usar diferentes expresiones de sentimiento para diferentes elementos, argumentamos que es mejor incorporar la información del usuario y del elemento en el modelo de tema para el análisis de sentimiento “.

Análisis del sentimiento del habla a través de las características ASR de extremo a extremo (PDF 2020)

ASR significa reconocimiento de voz automático. Este trabajo de investigación trata sobre la comprensión del habla y hacer cosas como dar más peso a las inflexiones que no son del habla, como la risa y la respiración.

La investigación comparte ejemplos del uso de la respiración y la risa como elementos ponderados para ayudarlos a comprender el sentimiento en el contexto del análisis del sentimiento del habla, pero no para fines de clasificación.

Estos son los ejemplos:

1. Sí, entonces [RISAS] está llamando ahora.
2. Bien, felicidades, eso es genial. [RESPIRACIÓN] No puedo esperar.
3. Exactamente, [RISA] Creo que eso irá genial, ¿no?
4. Eso sería maravilloso, eso sería genial en serio.

El documento describe el contexto de dónde es útil:

“El análisis del sentimiento del habla es un problema importante para los sistemas de inteligencia interactivos con amplias aplicaciones en muchas industrias, por ejemplo, servicio al cliente, atención médica y educación.

La tarea es clasificar una emisión de voz en una de un conjunto fijo de categorías, como positiva, negativa o neutral “.

Esta investigación es muy nueva, de 2020 y, aunque obviamente no es específica de la búsqueda, es indicativa del tipo de investigación que Google está haciendo y cómo es mucho más sofisticado que lo que el SEO reduccionista promedio ve como un simple factor de clasificación.

Sin sesgo de análisis de sentimientos en Google

Google ha declarado constantemente que intentan no mostrar páginas que reflejen la intención de un buscador (¿son los geckos mascotas malas?)

De hecho, Google dice lo contrario, que trata de mostrar una diversidad de opiniones. Google intenta no dejarse llevar por un sentimiento expresado en la consulta de búsqueda.

Google no permite que el sentimiento negativo expresado en la consulta de búsqueda lo influya para que muestre una página web con un sentimiento negativo.

Esto contradice directamente la idea de que Google muestra resultados de búsqueda con un sesgo de sentimiento específico si ese sesgo existe en la consulta de búsqueda.

Puede explorar las investigaciones y patentes de Google sobre el análisis de sentimientos y verá que el contexto se trata de comprender las consultas de búsqueda y las páginas web.

No verá investigaciones que indiquen que el sentimiento se utilizará para clasificar una página de acuerdo con su sesgo.

Si todas las páginas que Google clasifica tienen el mismo sentimiento, no asuma que es por eso que están allí.

De los documentos de investigación de Google, de las declaraciones de Google y de los resultados de búsqueda de Google, está claro que Google no permite que el sentimiento de la consulta de búsqueda del usuario influya en el tipo de sitios que Google clasificará.

Fuente y foto: https://www.searchenginejournal.com/does-google-use-sentiment-analysis-to-rank-web-pages/373171/