El término data lake se ha normalizado entre los CIOs y los CMOs, pero están siendo muchas las ocasiones en las que su implantación no está dando los resultados esperados. Los avances en las tecnologías de tratamiento y almacenamiento de información están permitiendo obtener valor de una información cada vez más dispar. También está permitiendo la toma de decisiones de forma más rápida.
Muchas empresas tratan de asegurar la rentabilidad de sus inversiones tecnológicas transformando su data lake pasivo en un mercado de datos activo.
Una de las novedades que aporta la gestión de datos con un data lake es facilitar un entorno que permita la congregación de información de fuentes muy dispares en estado bruto. Esta se ha visto como una vía para evolucionar (con menores costes de tiempo) el modelo de datawarehouse y datamart que hasta hace bien poco eran la clave del marketing de clientes.
Cada vez más en toda la organización, y no solo los departamentos de negocio como marketing, se entiende que su futuro está en maximizar el valor del cliente a largo plazo. Para esto es fundamental comprender el global de la experiencia del cliente con la compañía y, por lo tanto, incorporar la información que antaño estaba en los silos de marketing, operaciones, recursos humanos o finanzas. Esto ocurría cuando la empresa generaba datos para una acción promocional, la actividad comercial o de posventa, un estudio de mercado, el seguimiento de las operaciones o de recursos humanos y la información la utilizaba solo para ese uso.
Uno de los mayores riesgos que supone el uso de estas tecnologías es que degenere del data lake en un gran almacén de datos pasivos, lo que se denomina un data swamp. El éxito del data lake hace que crezca el número de usuarios que aportan y requieren información y el número de fuentes o la tipología de información. Aumenta así el riesgo de perder capacidad para identificar los contenidos y que el coste de recuperar la información pertinente sea tan alto que al final cada usuario simplemente utilice la parte a la que está habituado, volviendo de facto, a un sistema de silos.
¿Cómo preservar el valor y la usabilidad del data lake?
En primer lugar, conviene recordar que la filosofía del data lake está orientada a la demanda de información. Cada usuario puede reconstruir, a partir de datos brutos, la métrica de negocio al contrario de lo que ocurría con las bases de datos estructuradas, que facilitan las métricas ya elaboradas.
El valor incremental del data lake está en que cada vez más equipos puedan acudir a él de forma autónoma y descentralizada para extraer la información que necesitan. Por ejemplo, para que áreas operativas puedan mejorar sus procesos aplicando técnicas de process mining o las de recursos humanos puedan aumentar su aportación de valor acudiendo al people analytics.
Es importante que dispongamos de un Business Case que sirva de guía estratégica a la hora de implantar el data lake, contando que sus beneficios están más allá del ahorro de costes de almacenamiento. La reducción de tiempo para acceder y accionar la información, la capacidad de trabajar con nuevas fuentes de datos o el aumento del número de áreas de negocio que podrán mejorar su aportación de valor gracias a la analítica son elementos que deberá incorporar.
Los factores que van a asegurar el valor y la usabilidad del data lake son:
Para convertir un data lake pasivo en un mercado de datos activo aseguraremos el acceso autónomo y descentralizado a usuarios de distinto perfil. Para ello, junto a los requerimientos tecnológicos para asegurar la versatilidad de la información, es fundamental el correcto gobierno del dato. Este debe permitir, en todo momento, que el usuario conozca todos los detalles pertinentes de la información que puede llegar a demandar.
¿En qué ámbitos se concentran tus retos actualmente?
Algunos detalles para conocerte mejor
Ya casi terminamos 😊 Para poder contactar contigo y conocer mejor tus necesidades:
¡Ya has completado el formulario!
Revisaremos tu solicitud y nos pondremos en contacto contigo lo antes posible.