Por: CP Iván Rodríguez. Colaborador de Auditool 

En el actual entorno de transformación digital, muchas organizaciones están migrando rápidamente hacia arquitecturas modernas de datos como data warehouses[1] y data lakes[2]. Estas plataformas prometen un manejo unificado de la información, analítica avanzada, inteligencia artificial y, en última instancia, una toma de decisiones más informada. Sin embargo, detrás de esta posibilidad tecnológica se esconde una realidad menos visible pero crítica: el riesgo no desaparece cuando los datos se centralizan; se transforma, se amplifica y, en muchos casos, se vuelve más difícil de detectar. Esta realidad representa un desafío creciente para la auditoría, que además de evaluar controles tradicionales, debe comprender y revisar ecosistemas complejos de datos en constante evolución.

El riesgo no desaparece cuando los datos se centralizan; se transforma, se amplifica y, en muchos casos, se vuelve más difícil de detectar.

El mayor error conceptual

Cuando una organización emprende la labor de mover datos para un almacenamiento central, puede asumir uno de los mayores errores conceptuales y es considerar que el proceso es principalmente (o exclusivamente) técnico. La idea de extraer datos de sistemas fuente y cargarlos en una plataforma central parece sencilla, pero en realidad implica reconciliar múltiples realidades operativas. Los sistemas empresariales - ERP, CRM, sistemas financieros, plataformas de RRHH - han sido diseñados para fines transaccionales, no analíticos. Cada uno de ellos maneja definiciones distintas de los mismos conceptos, formatos incompatibles, reglas de negocio divergentes, evoluciones independientes en el tiempo. Como resultado, cuando estos datos se integran, surgen inconsistencias que no siempre son evidentes. Un mismo indicador - como ingresos o riesgo - puede tener significados distintos según su origen. Para la auditoría, esto genera un riesgo crítico y es tomar decisiones basadas en datos aparentemente confiables pero conceptualmente inconsistentes.

📊 La calidad de los datos

Un tema que debe tenerse en cuenta es la calidad de los datos. La centralización de datos no mejora automáticamente su calidad. Por el contrario, concentra y amplifica los errores existentes. Entre los problemas más frecuentes se encuentran:

• Datos duplicados o incompletos

• Valores inválidos

• Inconsistencias en datos maestros

• Reglas de negocio no alineadas

Un error en un sistema fuente puede propagarse a múltiples reportes, tableros (dashboards) y modelos analíticos. Adicionalmente, surge una pregunta clave que muchas organizaciones no logran responder con claridad: ¿Quién es responsable de la calidad del dato?, ¿El área de negocio que lo genera? ¿TI que lo procesa? ¿Analítica que lo transforma? La ambigüedad en la responsabilidad dificulta la corrección de errores y debilita la gobernanza.

🔄 Riesgos en las transformaciones de datos

De otra parte, durante el proceso de integración, los datos no se trasladan de forma pasiva[3]. se transforman y esto incluye: Limpieza, agregación, normalización y enriquecimiento. Y Aunque necesarias, estas operaciones introducen riesgos significativos:

• Scripts poco documentados

• Cambios sin control formal

• Pruebas insuficientes

• Dependencia de conocimiento individual

En muchos casos, los controles no evolucionan al mismo ritmo que la complejidad de los datos y para industrias reguladas, esto puede derivar en riesgos de cumplimiento, especialmente cuando los reportes regulatorios dependen de estos procesos.

🏚️ De data lakes a "data swamps"

La flexibilidad de los data lakes puede convertirse en un problema si no se gestiona adecuadamente. Sin una gobernanza sólida, estos entornos pueden convertirse en repositorios desorganizados ("data swamps"), fuentes de datos sin trazabilidad y ambientes con acceso descontrolado. Esto dificulta responder preguntas fundamentales:

• ¿De dónde provienen los datos?

• ¿Quién los validó?

• ¿Quién puede utilizarlos?

Además, los riesgos de seguridad aumentan debido a múltiples puntos de acceso y falta de clasificación adecuada de la información.

🖥️ La disparidad de sistemas y aplicativos

La disparidad de los sistemas y aplicativos es una dificultad adicional. A pesar de la modernización de plataformas, muchas organizaciones siguen dependiendo de sistemas heredados que no fueron diseñados para analítica, tienen limitaciones técnicas y requieren procesos manuales o soluciones temporales. Para usarlos se requiere de archivos planos, procesos batch y extracciones manuales, lo que introduce latencia o demora al procesar, datos incompletos y riesgo de error o manipulación

El nuevo rol de la auditoría

La auditoría, en este nuevo panorama, está dejando de ser un consumidor pasivo de información para convertirse en un evaluador de arquitecturas de datos, analista de gobernanza y asesor estratégico. Esto implica nuevas capacidades (y por tanto capacitación en):

• Comprensión básica de arquitecturas de datos

• Evaluación de controles tecnológicos

• Análisis de calidad e integridad de datos

• Capacidad de cuestionar supuestos

El enfoque trasciende el solo cumplimiento y pasa a garantizar confianza en la información. Es importante entontes que el auditor, al efectuar sus evaluaciones, tenga en cuenta los siguientes temas, que permiten identificar riesgos antes de que se materialicen.

🏛️ Gobernanza y responsabilidad
📋 Definición y consistencia
📊 Calidad de datos
🔄 Transformaciones
🔒 Seguridad

Cuando los datos se mueven, el riesgo se mueve con ellos. La diferencia está en si la organización decide gestionarlo estratégicamente o descubrirlo demasiado tarde.

La migración hacia plataformas modernas de datos no elimina la complejidad; la concentra. Por ello, las organizaciones que tienen éxito en este proceso son aquellas que diseñan controles desde el inicio, definen responsabilidades claras, implementan gobernanza sólida y facilitan la integración del área de auditoría desde etapas tempranas del proceso. La realidad es clara: cuando los datos se mueven, el riesgo se mueve con ellos. La diferencia está en si la organización decide gestionarlo estratégicamente o descubrirlo demasiado tarde.

[1] Es un sistema que agrega datos de varias fuentes en un único almacén de datos central y coherente. Esto facilita su análisis y procesamiento.

[2] Es un repositorio diseñado para almacenar grandes volúmenes de datos, que pueden ser estructurados, semiestructurados o no estructurados en una única plataforma.

[3] Basado en: When Data Moves, Risk Moves with It: The Hidden Challenges of Warehousing Data

 

CP Iván Rodríguez - CIE AF

Colaborador de Auditool

Auditor y consultor, diplomado en Alta Gerencia de Seguros y Derecho de Seguros. Especialista en Dirección Financiera y Desarrollo Organizacional, diplomado en Gerencia de la Calidad. Contador público (CP) de la Pontificia Universidad Javeriana con 20 años de experiencia en diversas empresas. Tiene amplia experiencia en la elaboración y ejecución de auditorías y revisorías fiscales. Dirección y ejecución de asesorías, consultorías y capacitaciones. Colaborador de Auditool.

Escribir un comentario

Enviar
× Progressive Web App | Add to Homescreen

Para instalar esta Web App en su iPhone/iPad presione el ícono. Progressive Web App | Share Button Y luego Agregar a la pantalla de inicio.

Desconectado