ETLs y acceso autónomo a la información
Analizando los datos
Desde el comienzo, para poder hacer analítica, siempre hemos necesitado de la ayuda de profesionales que nos ayuden a integrar, transformar y dar sentido a los datos de nuestra empresa para tomar decisiones.
Hoy en día, los empresarios necesitan acceso a la información de manera rápida, a veces a tiempo real y no podemos esperar en muchas ocasiones a que nos preparen los informes. El acceso autónomo a datos que permite a gestores y profesionales no técnicos consultar información de manera sencilla es cada vez más una realidad en las empresas.
Para ello es fundamental tener claro la procedencia de los datos para poder extraer y normalizar la información, contribuyendo a un data warehouse de consulta de manera ágil. Si bien muchas empresas optan por asumir la carga que supone el proceso de extracción y normalización como parte del análisis, muchas otras delegan el proceso de ETL y asumen únicamente la responsabilidad analítica.
A algunos subproductos de las ETLs como los lagos y almacenes de datos, los analistas pueden conectar y configurar herramientas para habilitar la consulta y generación de informes de una manera mucho más sencilla. Esta habilidad de obtener y comparar información crítica de una manera simple, es lo que convierte a la inteligencia de negocio en una pieza fundamental de las empresas modernas.
De esta manera, las personas que participan en la toma de decisiones pueden colaborar junto con los analistas (propios o subcontratados) de una manera más orgánica, mientras que los equipos de IT (en caso de existir) se dedican a su especialidad dentro de la empresa: mantenimiento informático, sensores de planta, desarrollo de producto, etc
ETL y calidad de los datos
Las herramientas ETL pueden mejorar significativamente la calidad de los datos. La habilidad de estandarizar y automatizar procesos ETL que mueven datos de diversas fuentes a un data warehouse estandarizado significa que uno es menos propenso a disponer de información errónea que pueden llevar a tomar malas decisiones.
En los procesos de ETL también se pueden incorporar herramientas específicas para garantizar la calidad. Muchas de estas herramientas se apoyan en el análisis estadístico, e incluyen entre otras, funciones que nos ayudan a validar y estructurar los datos y procedencia
ETL y metadatos
Es importante saber de dónde provienen nuestros datos. Los metadatos a menudo son la clave para entender esta procedencia y agregarla correctamente en nuestro análisis. En un proceso de ETL, cuando la herramienta extrae la información de la fuente para transformarla y cargarla en un almacén de datos o data warehouse, también extrae información contextual crítica relevante para la inteligencia de negocio.
Lo más habitual es que la ETL se encargue de añadir al conjunto de datos procesado información del área de negocio de la cual proviene la información, el modelo de datos a tratar, el proceso que se encarga de su extracción y transformación, la fecha de procesado, (para poder generar histórico), y otra información que puede resultar relevante.
Esta información se almacena en el data warehouse o en un repositorio similar junto con los datos transformados. Estos metadatos se pueden consultar con el fin de facilitar la agregación y comparación durante la fase de análisis, garantizando la calidad final al conocer exactamente la procedencia de los datos en cada momento.