Doctor mining: sistema text mining para localizar información sobre enfermedades pulmonares

Resumen

En la red mundial internet existe una gran variedad de información médica que las personas disponen a su alcance, esta información puede tender a ser errónea o proceder de sitios dudosos o poco fiables. Por otro lado, la tasa de mortalidad en la última década con base a las enfermedades pulmonares ha ocupado un gran número a nivel mundial, así que dada la gran importancia que tienen las enfermedades pulmonares actualmente en el mundo, los autores deciden desarrollar Doctor Mining, un sistema que provee información fidedigna a personas interesadas sobre este tipo de enfermedades a partir de la tecnología de recolección de textos (Text Mining), que permite gestionar información de distintas fuentes primarias académicas con el fin de agrupar y crear integraciones entre distintos componentes. El sistema se desarrolla con base a la metodología ágil ASUM-DM, y se plantea a partir de la creación de un modelo tipo pregunta-respuesta (Question-Answer) con el fin de que el usuario interesado interactúe por medio de preguntas. Por otro lado, la información que alimenta a dicho modelo se extrae a partir de bases de datos acreditadas por entidades de la salud internacionales como lo es el caso de la NIHL (National Institutes of Health Library). A partir del modelo construido y entrenado, se entrega al usuario por medio de la red social WhatsApp y a partir de allí el usuario realizará preguntas al modelo sobre alguna enfermedad de su preferencia, y éste, procesa los datos del corpus y genera una respuesta a dicha pregunta. Cómo resultado de este proyecto se entrega un sistema con un componente modelo pregunta-respuesta previamente evaluado y validado donde el usuario interactúa por medio de preguntas a fin de recibir una respuesta asertiva; este sistema es validado por más de 100 usuarios en el cual se encuentra que la percepción de la información entregada fue útil, entendible y accesible a las personas interesadas que hicieron uso de Doctor Mining.

Descripción

Abstract

In the world wide web there is a great variety of medical information that people have at their fingertips, this information can tend to be erroneous or come from dubious or unreliable sites. On the other hand, the mortality rate in the last decade based on lung diseases has occupied a large number worldwide, so given the great importance that lung diseases currently have in the world, the authors decided to develop Doctor Mining, a system that provides reliable information to people interested in this type of diseases from text mining technology, which allows managing information from different academic primary sources in order to group and create integrations between different components. The system is developed based on the agile methodology ASUM-DM and is based on the creation of a question-answer model (Question-Answer) so that the interested user interacts by means of questions. On the other hand, the information that feeds this model is extracted from databases accredited by international health entities such as the NIHL (National Institutes of Health Library). From the model built and trained, it is delivered to the user through the WhatsApp social network and from there the user will ask the model questions about a disease of their choice, and the model processes the corpus data and generates an answer to that question. As a result of this project a system is delivered with a question-answer model component previously evaluated and validated where the user interacts by means of questions to receive an assertive answer; this system is validated by more than 100 users in which it is found that the perception of the information delivered was useful, understandable and accessible to the interested people who made use of Doctor Mining.

Palabras clave

Enfermedades pulmonares, Minería de textos, Question and answer, Procesamiento de datos

Keywords

Lung diseases, Text mining, Q&A, Question and answer, Information extraction

Temáticas

Técnicas de diagnóstico del sistema respiratorio

Citación