Creación y evaluación de un diccionario marcado
con emociones y ponderado para el español

Ismael Díaz Rangel, Instituto Politécnico Nacional, México
Grigori Sidorov, Instituto Politécnico Nacional, México
Sergio Suárez Guerra, Instituto Politécnico Nacional, México

Ismael Díaz Rangel, Grigori Sidorov y Sergio Suárez Guerra, 2014: "Creación y evaluación de un diccionario marcado con emociones y ponderado para el español", Onomázein 29, 31-46.
DOI: 10.7764/onomazein.29.5

Resumen:
Este artículo presenta un método para la creación de diccionarios marcados con un valor específico (por ejemplo, las emociones, la polaridad) para su uso en varias tareas de procesamiento de lenguaje natural realizadas por computadoras.
En el diccionario creado las palabras seleccionadas se han etiquetado con seis emociones básicas. Para eso, las palabras primero fueron analizadas (anotadas) manualmente por múltiples evaluadores y ponderadas automáticamente a base de estas. El método se aplicó para el idioma español. Las palabras que conforman el diccionario fueron etiquetadas con las categorías emocionales básicas: alegría, enojo, miedo, tristeza, sorpresa y repulsión. A diferencia de otros diccionarios para computadoras, el diccionario propuesto contiene ponderaciones—porcentajes de probabilidad de ser usadas con un sentido emocional—. Cada palabra fue valorada por múltiples evaluadores, y posteriormente se realizó un análisis de concordancia con el método de kappa ponderado, adaptándolo para evaluadores múltiples. Con los resultados obtenidos, se propuso una medida que estima qué tan frecuente es el uso afectivo de una palabra: factor de probabilidad de uso afectivo (FPA), el cual sirve para dotar a las palabras potencialmente emocionales con un factor de peso. El FPA puede ser incluido como información en sistemas automáticos, por ejemplo, para la detección de sentimientos en texto. El FPA se refiere a la tendencia del uso de cada palabra, no es una característica absoluta. Así, es útil para los sistemas automáticos.