ADN Cloud

Innovación en la sociedad digital

Categorías
New Call-to-action

Qué son los metadatos y por qué son clave para un Data Warehouse

que son los metadatos
Tiempo de lectura: 3 minutos

El primer paso para ser una organización data driven y tomar decisiones basadas en los datos, reside en implementar un Data Warehouse – el almacén de datos. Y para ello, los metadatos juegan un papel fundamental, ya que se encargan de guiar los procesos ETL. En este artículo descubriremos qué son los metadatos y cuál es su importancia para el éxito de un proyecto de Data Warehousing.

¿Qué son los metadatos?

Los metadatos son información que describe a otro conjunto de datos. En general, se pueden definir como un directorio que nos ayuda a ubicar datos y al mismo tiempo nos facilita su descripción. Los metadatos se pueden clasificar en tres grandes categorías:

  • Metadatos de negocios, que dan soporte a los usuarios finales (como analistas y gerentes) e incorporan la información semántica sobre la propiedad de los datos, la definición del negocio y el cambio de políticas.
  • Metadatos técnicos, dirigidos a dar soporte a los usuarios de TI que implementan y operan el Data Warehouse: espacios de nombres de las bases de datos, nombres y tamaños de tablas y columnas, tipos de datos y valores permitidos, etc.
  • Metadatos operacionales: incluyen la información sobre la vigencia de datos (si están activos, archivados o purgados) y sobre el linaje de datos (migraciones y transformaciones aplicadas).

Además, los metadatos se pueden distinguir entre estáticos – utilizados para la documentación o navegación del sistema – y dinámicos – generados en tiempo real.

Cómo benefician los metadatos a un proyecto de Data Warehousing

Los metadatos permiten una administración eficiente de un Data Warehouse y juegan un papel central en todos los procesos de un proyecto de Data Warehousing: desde los procesos ETL (extracción,  transformación y carga de datos) hasta los procedimiento de visualización y generación de informes.

Los beneficios de los metadatos son enormes para todos los actores involucrados en un proyecto del Data Warehousing:

Los metadatos reducen drásticamente la carga de trabajo de los profesionales técnicos en tareas de mantenimiento. Les ayudan a evaluar el impacto de cualquier tipo de cambio en las estructuras de datos y en los procesos de carga y transformación de datos, proporcionando referencias cruzadas que se notifican a todos los usuarios.

Por otro lado, los usuarios de negocio pueden comprender mejor el origen de los datos, ya que los metadatos les proporcionan información sobre las fuentes de las cuales provienen. Además, estos usuarios encuentran información sobre las reglas y transformaciones que se aplicaron antes de que los datos estuvieran disponibles en el almacén, y pueden guardarlas y volverlas a utilizar como plantillas. En este sentido, los metadatos empoderan a los perfiles de negocio y aceleran su curva de aprendizaje en el uso del Data Warehouse.

En definitiva, los metadatos son el elemento esencial del flujo  de datos dentro de una compañía, constituyen una interfaz entre los desarrolladores y los perfiles de negocio, y por lo tanto, conducen a una toma de decisiones más rápida, clara, precisa y en el momento adecuado.

Los metadatos en el core de una herramienta ETL

Para beneficiarse de los metadatos, es necesario elegir una herramienta ETL que los incorpore a la base de todos sus procesos. Gracias a una herramienta ETL es posible establecer reglas de negocio para definir mapeos y transformaciones de datos a nivel abstracto. Además nos proporciona interfaces altamente usables de navegación de metadatos para visualizar de forma sencilla las dependencias, los linajes, los mapas de flujo de datos y las referencias cruzadas.

Los metadatos son una parte fundamental de un proceso ETL. Sin embargo, junto a muchos beneficios, introducen también importantes retos, que van desde su riesgo de dispersión en la organización, la dificultad de aplicación a datos particulares – como archivos de texto o multimedia – y la falta de estándares aceptados en toda la industria.

New Call-to-action

Entradas relacionadas

Deja un comentario

No hay comentarios

Todavía no hay ningún comentario en esta entrada.