Proyecto de código abierto: desarrollo de una herramienta para la detección de contenido generado por IA en textos
Cargando...
Archivos
Fecha
2024-12
Autores
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
El desarrollo de la herramienta se estructura de la preparación de los datos, identificar diferentes fuentes de datos para el entrenamiento del modelo, luego seleccionar el mejor lenguaje de programación que se adapte y tenga un fácil mantenimiento, por lo cual fue escogido Python 3, una vez seleccionado el lenguaje de programación, seleccionar el mejor modelo que se adapte y evolucione con futuras revisiones junto con sus librerías, una vez seleccionado el potencial modelo que fue GPT-2 para su base, se comenzó a diseñar y configurar el código con el modelo GPT-2, una vez diseñado el código, comienza la fase de implementación y entrenamiento del modelo, realizando ajustes en sus parámetros para dar una mejor precisión en sus decisiones, la fase final del código fue hacer un diseño interactivo para que el usuario pueda interactuar y probar la herramienta en una instancia local y posteriormente en un alojamiento web, la herramienta tiene la capacidad de además de hacer un análisis y una clasificación sobre el contenido de los archivos anexados , también puede exportar un archivo csv con los resultados de los análisis hechos. Por último, evaluar el modelo utilizando métricas de desempeño, con el propósito de analizar su precisión y exactitud a diferentes situaciones y comparar los mismos análisis con otros productos lanzados a producción como pueden ser GPTZero, ZeroGPT y Copyleaks.
Descripción
Abstract
The development of the tool is structured from the preparation of the data, identifying different data sources for training the model, then selecting the best programming language that fits and is easy to maintain, for which Python 3 was chosen, once the programming language was selected, select the best model that fits and evolves with future revisions along with its libraries, once the potential model was selected that was GPT-2 for its base, the code began to be designed and configured with the GPT-2 model, once the code was designed, the implementation and training phase of the model begins, making adjustments to its parameters to give better precision in its decisions, the final phase of the code was to make an interactive design so that the user can interact and test the tool in a local instance and later in a web hosting, the tool has the ability to, in addition to doing an analysis and a classification on the content of the attached files, it can also export a csv file with the results of the analysis done. Finally, evaluate the model using performance metrics, to analyze its precision and accuracy in different situations and compare the same analysis with other products released to production such as GPTZero, ZeroGPT and Copyleaks.
Palabras clave
GPT2, Aprendizaje Profundo, IA, Detector, Python, Lenguaje Natural, Perplejidad, Texto, Modelos, Palabras Comunes, Interfaz, Ingles
Keywords
GPT2, Deep Learning, AI, Detector, Python, Natural Language, Perplexity, Text, Models, Common Words, Interface, English