Modelo QSAR basado en redes neuronales artificiales para la predicción de la degradación de contaminantes farmacéuticos en cuerpos de agua a través de diferentes métodos fisicoquímicos

Resumen

Recientemente, el sector farmacéutico ha experimentado una alta expansión en el diseño, fabricación y comercialización de diferentes productos, de manera que entidades internacionales como la Organización Mundial de la Salud (OMS), y el programa de Naciones Unidas para el Medio Ambiente (PNUMA) han presentado gran inquietud por los problemas ambientales y de salud que pueden derivarse de su uso cotidiano. Una de las principales problemáticas es la contaminación hídrica, pues los diferentes procesos industriales, centros de salud, y actividades agrarias, generan una variedad de contaminantes emergentes (CEs), siendo los fármacos los más alarmantes, ya que persisten por un largo tiempo en el agua, la cual, al no ser tratada de una manera eficiente en las plantas de tratamiento puede provocar a la población resistencia antibacteriana, inhibir el crecimiento y movilidad sobre determinadas funciones en vertebrados (no mamíferos) e invertebrados, y producir diferentes efectos crónicos, como estrogénicos, genotóxicos, cancerígenos y teratogénicos. Esto puede darse debido a que no se emplean las técnicas más adecuadas para elegir un método que garantice una eliminación significativa de las trazas de dichos contaminantes. En vista de ello, se planteó y realizó el presente proyecto, que tuvo como finalidad construir un modelo QSAR (Quantitative Structure-Activity Relationship) basado en redes neuronales artificiales (ANN) para la predicción de la degradación de contaminantes farmacéuticos en cuerpos de agua a través de diferentes métodos fisicoquímicos. Se establecieron 4 fases correspondientes a los objetivos específicos planteados. En la primera y segunda fase, se recopilaron y categorizaron datos de diferentes artículos sobre porcentajes de degradación de moléculas orgánicas presentes en aguas residuales, y se procedió al modelamiento molecular de sus estructuras químicas a través del diseño y optimización estructural en Avogadro, con el campo de fuerza MMFF94. En la tercera fase se calcularon los descriptores moleculares de los fármacos por medio de PaDEL-Descriptor, y se recurrió a MatLab como software matemático para filtrar y relacionar todos los descriptores disponibles con las moléculas, cuyos porcentajes de degradación se conocieron por las fases anteriores. Se aplicaron 2 filtros, siendo el primero de ellos la eliminación de descriptores con valores iguales a 0 (cero), lo que simboliza que la característica química que cuantifica no está presente en ninguna molécula. El segundo filtro fue realizado a través de una correlación de Pearson, de la cual se seleccionaron los descriptores que eran menos colineales, es decir, los que eran menos similares dentro de un grupo especifico. Esto ayuda a describir características químicas distintas, haciendo que los modelos sean más robustos en cuanto a exactitud de predicción. En la cuarta fase, se hizo uso de la red neuronal artificial diseñada por el grupo INQA de la Universidad El Bosque, con el objetivo de elaborar el modelo matemático de 6 métodos fisicoquímicos (ozonización, ozonización + H2O2, carbón activado, radiación UV, fenton oscuridad y foto-fenton + H2O2), para los cuales, se seleccionaron los descriptores dependiendo de la cantidad de moléculas que ingresaban a la red neuronal, la información encontrada en la literatura sobre sus características, su colinealidad, y su relevancia química, es decir, aquellos que podrían calcular una característica significativa de la mayoría de las estructuras moleculares. Los modelos se dieron como validados una vez obtuvieron un coeficiente de determinación (R2) mayor a 0,70. Cabe destacar que no fue posible realizar la validación de 8 métodos, debido principalmente a que no se contaba con un numero aceptable de moléculas para entrenar la red neuronal. Sin embargo, la mayoría de los métodos fisicoquímicos que abordaban estos modelos, solo diferían de los validados en las condiciones de reacción. Finalmente, haciendo uso de los modelos validados, se realizó la predicción de los porcentajes de eliminación de fármacos pertenecientes a los grupos de medicamentos con mayor presencia en fuentes hídricas de Colombia (antibióticos, antihipertensivos, analgésicos, medicamentos de uso psiquiátrico y sustancias ilícitas), donde se pudo determinar que la ozonización es el mejor método de eliminación de dichos compuestos frente a los otros métodos estudiados, debido principalmente al poder oxidante del ozono al generar la formación de la radicales libres. Así mismo, se confirmó la eficacia de otros métodos, dentro los cuales está carbón activado, foto fenton y en algunos casos el uso de radiación UV, que depende en gran medida de la estabilidad de las moléculas frente a la fotólisis.

Descripción

Abstract

Recently, the pharmaceutical sector has experienced a high expansion in the design, manufacture and commercialization of different products, so that international entities such as the World Health Organization (WHO), and the United Nations Environment Program (UNEP) They have shown great concern about the environmental and health problems that may arise from their daily use. One of the main problems is water pollution, since the different industrial processes, health centers, and agricultural activities generate a variety of emerging pollutants (ECs), with drugs being the most alarming, since they persist for a long time in the environment. Water, which, by not being treated efficiently in treatment plants, can cause antibacterial resistance in the population, inhibit growth and mobility on certain functions in vertebrates (non-mammals) and invertebrates, and produce different chronic effects, such as estrogenic, genotoxic, carcinogenic and teratogenic. This can occur because the most appropriate techniques are not used to choose a method that guarantees a significant elimination of the traces of said contaminants. In view of this, the present project was proposed and carried out, whose purpose was to build a QSAR (Quantitative Structure-Activity Relationship) model based on artificial neural networks (ANN) for the prediction of the degradation of pharmaceutical pollutants in bodies of water at through different physicochemical methods. 4 phases corresponding to the specific objectives set were established. In the first and second phase, data from different articles on degradation percentages of organic molecules present in wastewater were collected and categorized, and molecular modeling of their chemical structures was carried out through design and structural optimization in Avogadro, with the field of force MMFF94. In the third phase, the molecular descriptors of the drugs were calculated by means of PaDEL-Descriptor, and MatLab was used as mathematical software to filter and relate all the available descriptors with the molecules, whose degradation percentages were known from the previous phases. Two filters were applied, the first being the elimination of descriptors with values equal to 0 (zero), which symbolizes that the chemical characteristic that it quantifies is not present in any molecule. The second filter was carried out through a Pearson correlation, from which the descriptors that were less collinear were selected, that is, those that were less similar within a specific group. This helps to describe different chemical characteristics, making the models more robust in terms of predictive accuracy. In the fourth phase, the artificial neural network designed by the INQA group of El Bosque University was used, with the aim of developing the mathematical model of 6 physicochemical methods (ozonation, ozonation + H2O2, activated carbon, UV radiation, fenton darkness and photo-fenton + H2O2), for which the descriptors were selected depending on the number of molecules entering the neuronal network, the information found in the literature on their characteristics, their collinearity, and their chemical relevance, that is, , those that could compute a significant feature of most molecular structures. The models were considered validated once they obtained a coefficient of determination (R2) greater than 0.70. It should be noted that it was not possible to validate 8 methods, mainly because there was not an acceptable number of molecules to train the neural network. However, most of the physicochemical methods that addressed these models only differed from those validated under the reaction conditions. Finally, using the validated models, the prediction of the percentages of elimination of drugs belonging to the groups of drugs with the greatest presence in water sources in Colombia (antibiotics, antihypertensives, analgesics, drugs for psychiatric use and illicit substances) was made. where it was possible to determine that ozonation is the best method of elimination of said compounds compared to the other methods studied, mainly due to the oxidizing power of ozone when generating the formation of free radicals. Likewise, the effectiveness of other methods was confirmed, among which is activated carbon, photofenton and in some cases the use of UV radiation, which depends to a large extent on the stability of the molecules against photolysis.

Palabras clave

Tratamientos fisicoquímicos, Red neuronal artificial INQA, Modelo QSAR, Contaminantes farmacéuticos

Keywords

Physicochemical treatments, INQA artificial neural network, QSAR model, Pharmaceutical contaminants

Temáticas

Citación