Modelo descriptivo para la comprensión de fenómenos políticos en las redes sociales aplicando minería de datos

Resumen

El presente estudio se enfoca en la investigación, desarrollo y análisis del uso de la minería de datos en el campo político social de Colombia, dado que las redes sociales han sido una gran fuente de información abierta para el público durante estos últimos años. El objetivo principal de esta tesis consiste en desarrollar un modelo descriptivo sobre un fenómeno político aplicando la minería de datos a una red social, que permita comprender los actores, flujos de información e interacciones que rigen el comportamiento del fenómeno desde la perspectiva biopsicosocial y cultural. Para esto se aplicó un modelamiento de análisis sentimental sobre las opiniones expresadas en Twitter por parte de los ciudadanos colombianos con respecto al fenómeno de inmigración venezolana que ocurre actualmente en el país. La metodología de este trabajo se basa principalmente en las etapas del proceso conocido como CRISP-DM la cual es utilizada para el desarrollo de proyectos de minería de datos. Para comenzar, se identificó un problema de investigación, el cual fue el fenómeno migratorio de los venezolanos en el país. Luego, mediante la red social seleccionada que fue Twitter se extrajeron, seleccionaron y procesaron los datos para el estudio. Para esto se hizo uso del API Tweepy de Twitter, que permitió la recolección de tweets, los cuales serán usados como los datos de este proyecto. Posteriormente al procesamiento de los datos, se realizó un análisis de opiniones para medir la variable del problema de investigación del proyecto, que consta de la aceptación y/o rechazo de la población colombiana a partir de las expresiones obtenidas mediante la red social Twitter relacionadas con el fenómeno de la inmigración venezolana.

Descripción

Abstract

This research focuses on the study, development, and analysis of the use of data mining in the social-political field of Colombia since social networks have been a great source of open information to the public in recent years. The main objective of this thesis is to develop a descriptive model of a political phenomenon applying data mining to a social network, which allows us to understand the actors, information flows, and interactions that govern the behavior of the phenomenon from the biopsychosocial and cultural perspective. A sentimental analysis modeling was applied to the opinions expressed on Twitter by Colombian citizens regarding the Venezuelan immigration phenomenon that is currently happening in the country. The methodology selected for this work was CRISP-DM, given the stages of this process, which is used for the development of data mining projects. Firstly, a research problem was identified, which was the migratory phenomenon of Venezuelans in the country. Then, through the selected social network that was Twitter, the data for the study were extracted, chosen, and processed. For this, the Twitter API Tweepy was used, which reached the collection of tweets, which will be used as the data for this project. After processing the data, an opinion analysis was carried out to measure the variable of the project's research problem, which consists of the acceptance or rejection of the Colombian population from the expressions obtained through the social network twitter related to the phenomenon of Venezuelan immigration.

Palabras clave

Minería de datos, Redes sociales, política, Análisis de sentimientos

Keywords

Data mining, Social networks, Politic, Sentiment Analysis

Temáticas

Citación