ADN Cloud

Innovación en la sociedad digital

Categorías
New Call-to-action

Qué son los metadatos y para qué sirven

que son los metadatos
Tiempo de lectura: 9 minutos

Los metadatos son información que describe a otro conjunto de datos. Un ejemplo clásico de metadatos son los catálogo de fichas de las bibliotecas, aunque su uso moderno se origina en el ámbito de la informática. El auge de Internet, y la reciente explosión de la información digital – conocida como Big Data – han traído nuevos significados, funcionalidades y usos para los metadatos. En este artículo descubriremos qué son los metadatos, para qué sirven y, como caso particular, su importancia para el éxito de un proyecto de Data Warehousing.

¿Qué son los metadatos?

Los metadatos se pueden definir como un directorio que nos ayuda a ubicar datos y al mismo tiempo nos facilita su descripción. La palabra “metadato” se compone del prefijo “meta”, que significa “más allá de” y “datos”, lo que en conjunto significa “información sobre los datos”.

El concepto de metadatos se remonta a las primeras bibliotecas, como una manera de catalogar las obras por cierto tipo de información, como el autor, el título o el sujeto (¡se dice que existía algo parecido a metadatos ya en la Antigua Biblioteca de Alejandría en el siglo III a. C.!). Sin embargo, es con la informática que los metadatos encuentran su uso moderno, en particular como manera de describir y catalogar a objetos digitalizados, como imágenes, documentos o contenido audiovisual, para una lectura humana o automatizada. En particular, con la difusión mundial de Internet, los metadatos se hacen cada día más necesarios, con el objetivo de facilitar la búsqueda de páginas Web y recursos online.

Diferencias entre datos y metadatos

No siempre es posible distinguir entre datos y metadatos. Por ejemplo, en el caso de metadatos que describen información de tipo textual, ambos son texto. Por lo cual, para entender qué son los metadatos tenemos que recurrir a otros tipos de ejemplos, como una imagen o un contenido sonoro: en estos casos, solamente los metadatos asociados podrán ser legibles, y nos permitirán tanto conocer más información sobre estos contenidos (el autor, la duración, el tamaño, la fecha de creación o de modificación, etc.), como almacenarlos de forma organizada para posteriormente encontrarlos fácilmente.

Algunos ejemplos típicos de metadatos son:

  • Encabezamientos de files multimedia
  • Catálogos de base de datos
  • Metaetiquetas HTML de páginas Web
  • Las direcciones IP
  • Encabezamientos de mensajes emails
  • Metadatos asociados a las llamadas telefónicas
  • Metadatos geoespaciales para describir objetos geográficos en mapas digitales

Qué son los metadatos: tipos

Como hemos visto, los metadatos abarcan distintos campos y tienen distintas aplicaciones. Sin embargo es posible clasificar las tipologías de metadatos según su objetivo:

  • Descriptivos, para descubrir e identificar la información.
  • Estructurales, que indican como se relacionan los objetos o recursos entre sí.
  • Administrativos, para ayudar a gestionar un recurso, e incluyen:
    • Metadatos de administración de derechos de propiedad intelectual.
    • Metadatos de preservación de recursos.
  • Estadísticos, para describir los procesos estadísticos de creación de datos
  • Metadatos de guía, para facilitar la búsqueda humana de recursos y expresados en un lenguaje natural.

El ciclo de vida de los metadatos

Es posible identificar tres distintas fases a lo largo del ciclo de vida de los metadatos:

  • Creación. En primer lugar, los metadatos son creados en relación con los recursos que necesitan describir. En este sentido, podemos distinguir entre metadatos creados manualmente o de forma automatizada.
    • Lo metadatos creados de forma manual permiten a los usuarios especificar cualquier información que consideren relevante, lo que aumenta la precisión.
    • Los metadatos creados automáticamente suelen especificar información mucho más general, como por ejemplo: tamaño, extensión, fecha de creación y el autor.
    • Finalmente, es posible crear metadatos de forma semiautomática.
  • Manipulación. En aquellas situaciones donde los datos se modifican, o cambia la finalidad para que son almacenados o analizados, también se necesita modificar o fusionar los metadatos asociados. En este caso, es preferible hacerlo de forma manual o semiautomática, ya que la intervención humana es fundamental.
  • Destrucción. En esta fase, los metadatos se pueden eliminar junto con los recursos asociados, o más bien mantenerse, con el objetivo de guardar un historial de creación y modificación de la información.  

Los metadatos en un Data Warehouse

Hemos visto qué son los metadatos y las principales tipologías y usos. Sin embargo, hay un caso en los cuales los metadatos juegan un papel fundamental, y se trata de la implementación de un Data Warehouse. Un Data Warehouse, también conocido como almacén de datos, es un repositorio que integra distintas fuentes de datos y cuya finalidad es apoyar el análisis avanzado de datos.

Los metadatos permiten una administración eficiente de un Data Warehouse y juegan un papel central en todos los procesos de un proyecto de Data Warehousing: desde los procesos ETL (extracción,  transformación y carga de datos en el almacén) hasta los procedimiento de visualización y generación de informes.

Para ello, se necesitan tres tipologías especiales de metadatos:

  • Metadatos de negocios, que dan soporte a los usuarios finales (como analistas y gerentes) e incorporan la información semántica sobre la propiedad de los datos, la definición del negocio y el cambio de políticas.
  • Metadatos técnicos, dirigidos a dar soporte a los usuarios de TI que implementan y operan el Data Warehouse: espacios de nombres de las bases de datos, nombres y tamaños de tablas y columnas, tipos de datos y valores permitidos, etc.
  • Metadatos operacionales: incluyen la información sobre la vigencia de datos (si están activos, archivados o purgados) y sobre el linaje de datos (migraciones y transformaciones aplicadas).

Metadatos: beneficios para Data Warehouse

Los beneficios de los metadatos son enormes para todos los actores involucrados en un proyecto de Data Warehousing, ya que:

  • Reducen drásticamente la carga de trabajo de los profesionales técnicos en tareas de mantenimiento. Les ayudan a evaluar el impacto de cualquier tipo de cambio en las estructuras de datos y en los procesos de carga y transformación de datos, proporcionando referencias cruzadas que se notifican a todos los usuarios.
  • Ayudan a los usuarios de negocio comprender mejor el origen de los datos, ya que los metadatos les proporcionan información sobre las fuentes de las cuales provienen. Además, estos usuarios encuentran información sobre las reglas y transformaciones que se aplicaron antes de que los datos estuvieran disponibles en el almacén, y pueden guardarlas y volverlas a utilizar como plantillas.
  • Empoderan a los perfiles de negocio y aceleran su curva de aprendizaje en el uso del Data Warehouse.
  • Permiten implementar interfaces altamente usables de navegación de metadatos para visualizar de forma sencilla las dependencias, los linajes, los mapas de flujo de datos y las referencias cruzadas.

En este sentido, los metadatos son el elemento esencial del flujo de datos dentro de una compañía, constituyen una interfaz entre los desarrolladores y los perfiles de negocio, y por lo tanto, conducen a una toma de decisiones más rápida, clara, precisa y en el momento adecuado.

En este artículo hemos visto qué son los metadatos y su importancia en la gestión de la información por parte de las empresas modernas. El primer paso para ser una organización data driven y tomar decisiones basadas en los datos, reside en implementar un Data Warehouse. Y para ello, los metadatos juegan un papel fundamental, ya que proporcionan aquella información adicional sobre los datos que permite su gestión y análisis.

Sin embargo los metadatos introducen también importantes retos, que van desde su riesgo de dispersión en la organización, la dificultad de aplicación a datos particulares – como archivos de texto o multimedia – y la falta de estándares aceptados en toda la industria. Además, algunos metadatos pueden ser utilizados para identificar patrones de conductas de personas u otra información personal que está protegida por la normativa de protección de datos.

Es por lo tanto fundamental conocer qué son los metadatos y poner en marcha una estrategia de gestión de este tipo de información.

Material relacionado

Artículos

eBooks

New Call-to-action

Entradas relacionadas

Deja un comentario

No hay comentarios

Todavía no hay ningún comentario en esta entrada.