Please use this identifier to cite or link to this item: http://repositorio.uisek.edu.ec/handle/123456789/3023
Title: Desarrollo de una herramienta de minería de datos para el análisis de influencia de cuentas automatizadas en temas de tendencia sobre la opinión de los usuarios de twitter en Ecuador
Authors: Riofrío Almeida, Daniel Andrés
Gordon Pico, Mario Emiliano
Keywords: SISTEMAS REDES
MACHINE LEARNING
CUENTAS AUTOMATIZADAS
MINERÍA DE DATOS
Issue Date: Jun-2018
Publisher: Universidad Internacional SEK
Citation: CT- MTI G662d/2018
Abstract: El crecimiento de las redes sociales y su popularidad en el mundo entero han sido razones para ser utilizadas con el fin de influenciar a los usuarios mediante contenido viral, noticias falsas o mensajes de interés político con el uso de bots. Estas técnicas han ido tomando popularidad para varias campañas en los últimos años, siendo una importante herramienta de difusión de información. En el presente trabajo se desarrolló una herramienta para la clasificación y análisis de tweets con el uso de técnicas de Machine Learning para mensajes en español, utilizando información de portales de noticias locales para el entrenamiento de varios modelos. Durante el procesamiento de datos se encontró que el algoritmo Multinomial Naïve Bayes tiene los mejores resultados de clasificación. Por otro lado, con el uso del algoritmo para detección de social bots de DeBot se almacenaron las cuentas automatizadas para un posterior análisis del índice de influencia de estas cuentas en 5 categorías: política, economía, deportes, entretenimiento y otros. Los resultados obtenidos reflejan la influencia de bots en las 5 categorías seleccionadas, cuyos niveles varían dependiendo de las horas del día o las noticias de interés que se susciten. El prototipo desarrollado permite el acceso a información condensada de la presencia e influencia de cuentas automatizadas en Twitter de los eventos cotidianos del país. Adicionalmente, abre la puerta para que se realicen más estudios sobre estas plataformas en los que se beneficie la comunidad.
Description: The growth of social media and its popularity around the world are the main reasons they have been used to influence its users through viral content, fake news or messages of public interest using bots. These techniques have gained popularity and been used in numerous campaigns in recent years, becoming an important tool for disseminating information. This work shows the development of a tool for classification and analysis of tweets using Machine Learning for messages written in Spanish using information gathered from local online news to train a few models. While processing the data, we found that Multinomial Naïve Bayes has achieved the best classification results. On the other hand, we used DeBot to detect social bots and save automated accounts detected for a later analysis of the influence index of these accounts in 5 categories: politics, economy, sports, entertainment and other. Our results show bots’ influence in those 5 categories varies depending on the hour of the day or the current local news of interest. The prototype developed allows access to a summarized way of visualizing the influence of automated accounts in Twitter in a daily basis on issues of the country. Additionally, this work opens the door for studies to come on these platforms which will benefit our community.
URI: http://repositorio.uisek.edu.ec/handle/123456789/3023
Appears in Collections:(MTI)

Files in This Item:
File Description SizeFormat 
tool.rar2.72 MBUnknownView/Open
Tesis Mario Gordon.pdf1.42 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.