Revisión teórica sobre la influencia de los Data Lakes en la gestión de la información y la productividad financiera en el sector bancario global

Cargando...
Miniatura

Fecha

Título de la revista

Publicado en

Publicado por

URL de la fuente

Enlace a contenidos multimedia

ISSN de la revista

Título del volumen

Resumen

Este artículo presenta una revisión teórica de la literatura académica y profesional sobre los Data Lakes y su adopción en el sector bancario, donde se destaca su relación con la productividad financiera y los avances hacia modelos analíticos más integrados. La revisión se enmarcó en un contexto teórico que distinguió entre data warehouse, data lake y lakehouse, y que articuló gobierno de datos (metadatos, linaje, catálogos), calidad (SLA, latencia y confiabilidad), seguridad y privacidad en banca, así como el rol de la analítica avanzada/IA. Metodológicamente, se aplicó una revisión de alcance (2018–2025) con protocolo tipo PRISMA, búsqueda en bases académicas y repositorios de acceso abierto, criterios de inclusión por pertinencia sectorial y rigor metodológico, y una matriz de extracción con variables sobre arquitectura, gobierno, método, indicadores de gestión de la información (catálogo activo, linaje, frescura y latencia) e indicadores de productividad financiera (ROA, ROE, cost-to-income, reducción de tiempos de consulta y de originación). La síntesis discutió patrones y vacíos: se observó mejora consistente del time-to-insight, mayor reutilización y cumplimiento cuando existió gobierno efectivo; se evidenció heterogeneidad en métricas y escasez de diseños causales con resultados financieros duros; y se destacó, para América Latina y Colombia, un contexto regulatorio favorable por finanzas abiertas, aunque con medición aún incipiente. En conjunto, la revisión dejó una base conceptual y operativa para evaluar, en estudios posteriores, impactos financieros y de eficiencia asociados a la adopción de estas arquitecturas en banca.

Descripción

Abstract

This article presents a theoretical review of the academic and professional literature on Data Lakes and their adoption in the banking sector, highlighting their relationship with financial productivity and the progress toward more integrated analytical models. The review was framed by a theoretical lens that distinguished among the data warehouse, data lake, and lakehouse, and that organized data governance (metadata, lineage, catalogs), data quality (service-level agreements, latency, reliability), and security and privacy in banking, as well as the role of advanced analytics and AI. Methodologically, a scoping review (2018–2025) following a PRISMA-type protocol was applied, drawing on academic databases and open-access repositories, with inclusion criteria based on sector relevance and methodological rigor, and an extraction matrix capturing variables on architecture, governance, method, information-management indicators (active catalog, lineage, freshness, latency), and financial-productivity indicators (ROA, ROE, cost-to-income, and reductions in query and origination times). The synthesis discussed patterns and gaps: it observed consistent improvements in time-to-insight, greater reuse, and stronger compliance when effective governance was in place; it found heterogeneous metrics and a shortage of causal designs linking technology adoption to hard financial outcomes; and it noted, for Latin America and Colombia, a favorable regulatory setting for open finance, though measurement remained incipient. Overall, the review provided a conceptual and operational basis to evaluate, in subsequent studies, financial and efficiency impacts associated with the adoption of these architectures in banking.

Palabras clave

Lagos de datos, Gestión de la información, Banca, Gobernanza de datos, Desempeño financiero

Temáticas

Citación

Aprobación

Revisión

Complementado por

Referenciado por