Librería para reconocimiento de emociones: procesamiento de lenguaje natural y señales de audio

Resumen

El reconocimiento de emociones a través de información obtenida por audio y texto se ha vuelto una herramienta poderosa para extraer o identificar información valiosa a partir de diferentes expresiones humanas. Las emociones son una parte esencial de nuestro día a día y pueden proveer información relevante. Entonces, no se puede negar la importancia de estas como una fuente de información valiosa y crítica. A pesar de que hoy en día se pueden encontrar soluciones a esta oportunidad que brinda el reconocimiento de emociones, a la fecha no hay herramientas que faciliten este reconocimiento en el idioma español, especialmente que estén diseñadas específicamente para apoyar a los desarrolladores. Por lo tanto, en este proyecto, se realiza un análisis de los individuos que pueden aprovechar la cantidad masiva de audio que es transferida hoy en día, sus creencias, hábitos y artefactos que suelen utilizar. A partir de esto, este proyecto propone una librería en el lenguaje de programación Python para reconocimiento de emociones híbrido, que valiéndose de herramientas de machine learning y modelos de inteligencia artificial, le facilitará a otros desarrolladores la posibilidad de implementar un artefacto que identifique emociones a través de una entrada de audio y que procese tanto el audio ingresado como el texto extraído del mismo, para brindar una mayor precisión con respecto a la clasificación. Para desarrollar el artefacto propuesto en el proyecto se emplea una combinación de dos metodologías, Feature-Driven Development (FDD) y Lean Software Development (LSD). Valiéndose de estas metodologías el proceso que se llevó a cabo fue transparente con respecto a las características o requerimientos que fueron identificados en el trayecto. Asimismo, y considerando la criticidad de los tiempos en torno al proyecto, LSD representa un complemento perfecto a FDD, brindando un enfoque a calidad y agilismo evitando el desperdicio y priorizando la optimización. En la etapa final del proyecto, los esfuerzos se enfocan en realizar una validación de la librería. Esta validación permite identificar falencias, ventajas, desventajas y oportunidades de mejora, que al final darán información valiosa para el mejoramiento a futuro de la librería. Como resultado se cuenta con una librería que fue evaluada por desarrolladores y que cumplió con los objetivos que se planearon inicialmente que permite realizar reconocimiento de emociones a través de un modelo bimodal.

Descripción

Abstract

Emotion recognition has become a powerful tool to identify or extract valuable information from different human expressions. Emotions are an essential part of our day to day. They can provide relevant information for recommendations of music, movies, series, news, among others. So, we can not deny emotion's importance as a source of valuable and critical information. Nowadays we can find solutions to the opportunity that emotion recognition gives us, however to date there is not an existing tool that helps with emotion recognition in the language Spanish, specifically tools designed to support developers. Therefore, in this project, we made an analysis about who can take advantage of the massive amount of audio that is transferred today, we analyzed the beliefs, habits and artifacts they often use. Consequently, this project proposes a library in the programming language Python that implements emotion recognition through a hybrid model using both audio and text. With the use of technologies such as machine learning and artificial intelligence models, we can make it easier for developers to implement a solution that integrates emotion identification through an audio input that processes the audio and the text extracted from it to achieve a higher precision in the classification process.

Palabras clave

Reconocimiento de emociones, Procesamiento de lenguaje natural, Procesamiento de señales de audio, Aprendizaje de máquina, Modelo bimodal, NLTK, CNN, SVM

Keywords

Emotion recognition, Natural language process, Audio signal processing, Machine learning, Bimodal model, NLTK, CNN, SVM

Temáticas

Citación