Evaluación de la producción científica de investigadores con métricas y altmétricas a partir de bases de datos bibliográficas dinámicas
Cargando...
Archivos
Fecha
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
El presente trabajo desarrolla un sistema automatizado para evaluar la producción científica de investigadores en física y astronomía mediante la integración de procesos ETL, métricas bibliométricas, altmétricas y modelos predictivos. A partir de datos dinámicos obtenidos de OpenAlex, se construyó una base consolidada que permitió calcular indicadores clásicos y normalizados, analizar redes de colaboración y estudiar la diversidad temática mediante modelos de lenguaje preentrenados. La evolución temporal del impacto se modeló con funciones de crecimiento acumulado, mostrando que el modelo de Gompertz describe con alta precisión las curvas de citación. Además, se implementó un modelo XGBoost capaz de predecir de forma robusta el número anual de citas, explicando más del 70 % de su variabilidad futura. El análisis aplicado a tres investigadores representativos evidenció diferencias en productividad, patrones de colaboración e influencia académica, mostrando la utilidad de combinar métricas tradicionales con enfo ques de aprendizaje automático. En conjunto, los resultados demuestran que esta metodología ofrece una herramienta reproducible, transparente y flexible para la evaluación y proyección del impacto científico.
Descripción
Abstract
The present work develops an automated system to evaluate the scientific output of researchers in physics and astronomy through the integration of ETL processes, bibliometric metrics, altmetrics, and predictive models. Using dynamic data obtained from OpenAlex, a consolidated database was constructed that enabled the calculation of classical and normalized indicators, the analysis of collaboration networks, and the study of thematic diversity through pretrained language models. The temporal evolution of impact was modeled using cumulative growth functions, showing that the Gompertz model describes citation curves with high accuracy. In addition, an XGBoost model was implemented to robustly predict the annual number of citations, explaining more than 70% of their future variability. The analysis applied to three representative researchers revealed differences in productivity, collaboration patterns, and academic influence, demonstrating the usefulness of combining traditional metrics with machine learning approaches. Overall, the results show that this methodology provides a reproducible, transparent, and flexible tool for the evaluation and projection of scientific impact.
Palabras clave
Métricas bibliométricas, Análisis bibliométrico, Producción científica, Bases de datos dinámicas
