Cómo convertir un data lake pasivo en un mercado de datos activo

 

El término data lake se ha normalizado entre los CIOs y los CMOs, pero están siendo muchas las ocasiones en las que su implantación no está dando los resultados esperados. Los avances en las tecnologías de tratamiento y almacenamiento de información están permitiendo obtener valor de una información cada vez más dispar. También está permitiendo la toma de decisiones de forma más rápida.

 Muchas empresas tratan de asegurar la rentabilidad de sus inversiones tecnológicas transformando su data lake pasivo en un mercado de datos activo.

Datalake blog

¿Qué aporta un data lake?

Una de las novedades que aporta la gestión de datos con un data lake es facilitar un entorno que permita la congregación de información de fuentes muy dispares en estado bruto. Esta se ha visto como una vía para evolucionar (con menores costes de tiempo) el modelo de datawarehouse y datamart que hasta hace bien poco eran la clave del marketing de clientes.

Cada vez más en toda la organización, y no solo los departamentos de negocio como marketing, se entiende que su futuro está en maximizar el valor del cliente a largo plazo. Para esto es fundamental comprender el global de la experiencia del cliente con la compañía y, por lo tanto, incorporar la información que antaño estaba en los silos de marketing, operaciones, recursos humanos o finanzas. Esto ocurría cuando la empresa generaba datos para una acción promocional, la actividad comercial o de posventa, un estudio de mercado, el seguimiento de las operaciones o de recursos humanos y la información la utilizaba solo para ese uso.

Uno de los mayores riesgos que supone el uso de estas tecnologías es que degenere del data lake en un gran almacén de datos pasivos, lo que se denomina un data swamp. El éxito del data lake hace que crezca el número de usuarios que aportan y requieren información y el número de fuentes o la tipología de información. Aumenta así el riesgo de perder capacidad para identificar los contenidos y que el coste de recuperar la información pertinente sea tan alto que al final cada usuario simplemente utilice la parte a la que está habituado, volviendo de facto, a un sistema de silos.

cta-data-dovernance

¿Cómo preservar el valor y la usabilidad del data lake?

En primer lugar, conviene recordar que la filosofía del data lake está orientada a la demanda de información. Cada usuario puede reconstruir, a partir de datos brutos, la métrica de negocio al contrario de lo que ocurría con las bases de datos estructuradas, que facilitan las métricas ya elaboradas.

El valor incremental del data lake está en que cada vez más equipos puedan acudir a él de forma autónoma y descentralizada para extraer la información que necesitan. Por ejemplo, para que áreas operativas puedan mejorar sus procesos aplicando técnicas de process mining o las de recursos humanos puedan aumentar su aportación de valor acudiendo al people analytics.

Es importante que dispongamos de un Business Case que sirva de guía estratégica a la hora de implantar el data lake, contando que sus beneficios están más allá del ahorro de costes de almacenamiento. La reducción de tiempo para acceder y accionar la información, la capacidad de trabajar con nuevas fuentes de datos o el aumento del número de áreas de negocio que podrán mejorar su aportación de valor gracias a la analítica son elementos que deberá incorporar.

Los factores que van a asegurar el valor y la usabilidad del data lake son:

  • Orientado a cliente: el primer paso para que el data lake sea un mercado de datos activo está en la correcta planificación del proyecto. Permitir que crezca a medida que se identifican necesidades de negocio dentro de la organización.
  • Multivalente: Mantener tanto áreas de información bruta como áreas de datamart con la información pretratada y estructurada para facilitar el acceso a distintos perfiles de usuarios.
  • Versatilidad: Junto a las tecnologías de gestión de la información, disponer de aplicaciones que ejecuten de manera ágil y flexible la fase de preparación del dato.
  • Gobierno del dato: es fundamental que el gobierno del dato incluya, a medida que se incorporan fuentes en el data lake, su completo mapeo. Junto a la tipología y naturaleza de cada indicador, conocer la vinculación a los procesos de negocio permitirá entender cómo se ha generado la información, con qué objetivo. Permitirá conocer las vinculaciones de negocio más allá de los datos, qué equipos de la empresa están detrás de los datos y en qué condiciones y con qué objetivo han sido recogidos.

Para convertir un data lake pasivo en un mercado de datos activo aseguraremos el acceso autónomo y descentralizado a usuarios de distinto perfil. Para ello, junto a los requerimientos tecnológicos para asegurar la versatilidad de la información, es fundamental el correcto gobierno del dato. Este debe permitir, en todo momento, que el usuario conozca todos los detalles pertinentes de la información que puede llegar a demandar.

Más noticias

¿Cómo se ejecuta un proyecto de automatización de procesos con RPA?

La automatización de procesos con RPA es una de las tendencias en la transformación digital. La posibilidad de automatizar tareas, para que las personas puedan dedicar su tiempo y esfuerzo a tareas...

Leer másArrow 41

Explainability AI: cómo hacer nuestro modelo legible

A la hora de tomar decisiones, la inteligencia artificial se ha convertido en una herramienta muy útil en el día a día. Lo curioso es que esto es así tanto en el ámbito personal como en el laboral....

Leer másArrow 41

Inversión en tecnología: clave para hacer frente a la crisis económica

La crisis económica es una realidad palpable en la actualidad. La inflación de los precios, la poca disponibilidad de los combustibles, así como la lenta recuperación de la Covid-19, han hecho que...

Leer másArrow 41

Supply chain: tendencias y retos tecnológicos

En el mundo empresarial contemporáneo, la gestión efectiva de la cadena de suministro es fundamental para el éxito y la competitividad de las organizaciones. La cadena de suministro, o supply chain...

Leer másArrow 41

Cómo diseñar una estrategia de IA para incrementar el éxito de los proyectos de Machine Learning

En el Webinar “AI Strategy: Cómo diseñar una estrategia de IA para incrementar el éxito de los proyectos”, hemos compartido una visión acerca de aquellos problemas generales que hacen que proyectos...

Leer másArrow 41