Project ++: Lenguaje de dominio específico para planificar proyectos con CRISP-DM

Resumen

En la ejecución de proyectos de minería de datos bajo la metodología CRISP-DM, es indispensable tener control de las fases que se vienen desarrollando, con el fin de acercarse más a buen término. Sin embargo, en la actualidad, cuando se trata de implementar dicha metodología, no se tiene un artefacto que permita la planificación, teniendo en cuenta todos los requisitos de cada fase y se acude entonces herramientas generales de planificación de proyectos y a la experiencia de actores que tuvieron que aprender a la fuerza, la forma de desarrollar dicha metodología. En este proyecto se llevó a cabo la construcción de un Lenguaje de Dominio Específico (DSL) orientado a la planificación de proyectos de Minería de datos bajo la metodología CRISP-DM, teniendo en cuenta cada una de sus fases. Esto con el objeto de tener al alcance y de forma clara cada uno de los requisitos de las fases de la metodología y de esta forma poder transmitir ese conocimiento. El proyecto fue desarrollado haciendo uso de la metodología de prototipado y el Lenguaje de Dominio Específico se construyó con ayuda de la herramienta MPS de JetBrains. Se realizaron entrevistas a Gerentes de TI y profesionales con conocimientos en el área de TI y Gerencia de proyectos, para analizar la problemática a solucionar y recibir retroalimentación de una muestra del artefacto, de acuerdo con la retroalimentación recibida la idea es innovadora, y es bien recibida como herramienta de planificación de proyectos de minería de datos.

Descripción

Abstract

In the execution of data mining projects under the CRISP-DM methodology, it is essential to have control of the phases that are being developed, in order to get closer to a successful conclusion. However, currently, when it comes to implementing this methodology, there is no device that allows planning, taking into account all the requirements of each phase and then general project planning tools and the experience of actors who they had to learn by force how to develop said methodology. In this project, the construction of a Domain Specific Language (DSL) was carried out oriented to the planning of data mining projects under the CRISP-DM methodology, taking into account each of its phases. This in order to have within reach and clearly each of the requirements of the phases of the methodology and thus be able to transmit that knowledge. The project was developed using the prototyping methodology and the Domain Specific Language was built with the help of the JetBrains MPS tool. Interviews were conducted with IT Managers and professionals with knowledge in the area of IT and Project Management, to analyze the problem to be solved and receive feedback from a sample of the artifact, according to the feedback, the idea is innovative, and it is well as a planning tool for data mining projects received.

Palabras clave

Minería de datos, Lenguaje de Dominio Específico, CRIPS-DM, Metodología, DSL

Keywords

Data Mining, Methodology, Domain-Specific Language, CRISP-DM, DSL

Temáticas

Citación