Diseño de un flujo óptimo de análisis computacional para datos exómicos, enfocado al diagnóstico clínico de variantes genómicas
Cargando...
Fecha
Autores
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
En los últimos años, el empleo de la secuenciación clínica del exoma como prueba de diagnóstico clínico de enfermedades genéticas ha aumentado. Esta prueba es ofertada en la institución prestadora de servicios de salud Biotecgen S.A.S. y su análisis está a cargo de la unidad de biología computacional donde se desarrolló este estudio. Debido a la amplia oferta de herramientas computacionales de mapeo y llamado de variantes, enfocadas al análisis de variantes en datos de exomas, se considera necesario el establecimiento de un flujo óptimo de análisis computacional que se ajuste a los requerimientos específicos de la institución.
Para diseñar el flujo óptimo de trabajo se establecieron siete métricas: tiempo de ejecución, precisión, sensibilidad, falsos positivos por millón, consumo de memoria RAM y núcleos de procesamiento de la CPU, que permitieron evaluar el rendimiento de 18 flujos de trabajo, considerando especialmente el tiempo en el que se deben procesar las muestras y la precisión del análisis que es clave para obtener una identificación correcta de las variantes.
La realización de esta evaluación comparativa permitió establecer que el mejor flujo de trabajo lo conforma el mapeador BWA_MEM2 y el llamador de variantes Strelka2, que presenta un alto rendimiento en la identificación de variantes homocigotas y heterocigotas y reduce el tiempo de procesamiento de muestras de 150 exomas por mes a 2,6 días. Esta reducción significativa de tiempo influye en el diagnóstico temprano de la enfermedad en los pacientes remitidos a Biotecgen S.A.S.
Descripción
Abstract
In recent years, the use of clinical exome sequencing as a clinical diagnostic test for genetic diseases has increased. This test is offered at the health services provider Biotecgen S.A.S. and its analysis is in charge of the computational biology unit where this study was developed. Due to the wide offer of computational tools for variant mapping and calling, focused on the analysis of variants in exome data, it is considered necessary to establish an optimal computational analysis flow that fits the specific requirements of the institution.
To design the optimal workflow, seven metrics were established: execution time, accuracy, sensitivity, false positives per million, RAM consumption and cpu percentage, which allowed evaluating the performance of 18 workflows, especially considering the time in which samples must be processed and the accuracy of the analysis, key to obtain a correct identification of variants.
This comparative evaluation established that the best workflow is the BWA_MEM2 mapper and Strelka2 variant caller, which has a high performance in identifying homozygous and heterozygous variants and reduces sample processing time from 150 exomes per month to 2.6 days. This significant time reduction influences the early diagnosis of the disease in patients referred to Biotecgen S.A.S.
Palabras clave
Exoma, Evaluación comparativa, Llamado de variantes, Diagnóstico clínico, Variantes genómicas
