¿En qué consiste el análisis de sentimiento? ¿Qué métodos existe para realizar este tipo de análisis de textos?
¡Hola, investigadores! Volvemos con una nueva entrada de la serie «Le Sphinx: herramientas de investigación social y de mercados» del Blog de la Fundación iS+D, de la mano de Le Sphinx Iberoamérica, partner colaborador de la Fundación iS+D.
En esta ocasión hablaremos del análisis de sentimiento y de los métodos que existen para realizar este tipo de análisis de textos.
El análisis de sentimiento
Las personas nos expresamos de distintas formas y desde distintos medios: damos nuestra opinión en encuestas, en las redes sociales, en grupos focales, entrevistas…
En el mundo de la investigación social, es esencial conocer la opinión del público que estudiamos de la manera más exhaustiva y exacta para comprender realmente qué sienten y tomar así acciones pertinentes y adecuadas según cada tipo de objetivo o necesidad.
En este sentido, el análisis de texto nos permite tener una visión mucho más amplia y precisa sobre la opinión de las personas encuestadas o clientes/as, y así poder obtener conclusiones más fieles con la realidad.
Uno de los tipos de análisis de textos es el análisis de sentimiento, a través del cual se capta la orientación de esos comentarios para saber si estos tienen un tono positivo o negativo.
Existen diferentes métodos para realizar el análisis de sentimiento: el manual y el automatizado. A continuación explicaremos cada uno de los métodos, así como sus ventajas y sus limitaciones.
- Existen dos métodos automatizados para realizar análisis de sentimiento: el cognitivo o tradicional y el machine learning.
Codificación manual
Es la codificación de toda la vida. Consiste en ir leyendo cada comentario e ir identificando la orientación de ese comentario (positivo, negativo o neutro) para luego obtener las frecuencias de cada una de esas categorías, con el objetivo de cuantificarlas y conocer cuál es la orientación mayoritaria. Al hacer esto, transformamos nuestros datos textuales en datos numéricos, los cuales nos ofrecen más posibilidades a la hora de realizar el análisis, pues los podremos combinar con los demás datos recogidos y extraer mejores conclusiones.
Es la mejor opción si disponemos de pocos comentarios, ya que requiere de mucho tiempo para leerlos.
Ventajas | Limitaciones | Permite tener una visión más clara de los datos
Se capta bien la ironía Casi no requiere de herramientas Se puede hacer a la vez que realizamos la codificación temática y se ahorraría tiempo | No adecuado para un volumen grande de comentarios
No se puede analizar en tiempo real Falta de objetividad y distintos puntos de vista si se realiza por más de 1 evaluador Posible error humano: una misma persona puede codificar de diferentes maneras |
---|
Método automatizado
Este método requiere de tecnología que ayuda al ser humano a hacer las tareas de una forma más rápida y fácil mediante la automatización. Se utiliza para bases de datos amplias.
Existen dos métodos dentro de este: el cognitivo o tradicional y el machine learning.
Método cognitivo o tradicional:
Basándose en reglas gramaticales (análisis sintáctico y semántico) combinadas con diccionarios, bases de datos terminológicas, etc., el programa lee los comentarios y establece la orientación. Es una descripción del lenguaje. Aquí entran en juego los/as lingüistas, ya que son quienes establecen esas reglas para la identificación de la orientación (también para el análisis temático).
Este método es el más utilizado y el más antiguo. Su mantenimiento es difícil, ya que con el tiempo, al crear reglas léxicas nuevas, se puede alterar la calidad del análisis, pues unas reglas pueden contradecir otras y el resultado puede no ser del todo bueno.
Machine learning:
Creado en 2018, es uno de los métodos de análisis textual más innovadores. Está formado por un algoritmo de proceso de lenguaje natural, el cual debe ser alimentado previamente con miles de comentarios ya codificados para que así el algoritmo aprenda cómo se analizan. Una vez entrenado, será capaz de codificar los comentarios según ese entrenamiento previo.
La gran ventaja de este método es que, aunque se equivoque, el propio algoritmo aprende, pues podemos corregir los errores detectados, se puede entrenar sobre nuevos ámbitos, añadir idiomas nuevos, etc.
Ventajas | Limitaciones | Permite analizar muchos datos
Análisis en tiempo real Es objetivo, hay acuerdo entre evaluadores/as Se puede usar para distintos ámbitos Transferencia entre idiomas Muy fácil de mejorar Puede analizar datos «sucios» | Entender la ironía puede ser complicado
Requiere de una herramienta para realizarlo |
---|
Alternativas al análisis de sentimiento
Además de los métodos anteriormente descritos, existen distintas alternativas o trucos que se pueden aplicar para captar el sentimiento de los comentarios sin necesidad de analizar la orientación.
- Usar la nota de satisfacción general: es una pregunta muy típica en las encuestas. Con ella, podemos filtrar los comentarios según dicha nota. Sin embargo, limita los resultados, ya que pueden no ser del todo reales: alguien puede poner que se encuentra satisfecho, pero luego que su comentario sea negativo.
- Poner dos campos abiertos en el cuestionario: en uno de ellos se puede pedir un comentario negativo (“¿qué mejorarías?”) y en el otro, algo positivo (“¿qué es lo que más te ha gustado?”). De esta manera, tendríamos la lista de comentarios positivos y la lista de comentarios negativos sin necesidad de analizar el sentimiento. En el caso en el que se quiera extraer una variable de orientación o se quieran unir para realizar un análisis conjunto (por ejemplo, codificar todos los comentarios para extraer los temas y organizarlos según su orientación), se podría modificar la unidad estadística de la base de datos: en lugar de haber una columna/variable por cada orientación (positivo y negativo), los unificamos en una sola y creamos otra seguida que determina el tipo de orientación. Así, podríamos disponer de las frecuencias de la orientación y analizarlas con otra información (temas extraídos, producto/servicio, perfil…).
Thomas Le Forestier
Director Le Sphinx España/LATAM
Juan Chamorro Soler
Responsable sector educativo en Le Sphinx España/LATAM
Acerca de Le Sphinx
Le Sphinx es una empresa surgida en Francia con presencia en más de 60 países y más de 30 años de experiencia en el desarrollo de software para la gestión de todo tipo de estudios, tanto para la investigación social en el ámbito académico-científico como para la investigación de mercados: software de encuestas, análisis y visualización de datos cuantitativos y cualitativos.
Cuentan con un equipo de expertos/as en ciencia de datos y desarrolladores/as especializados/as.