ADN Cloud

Innovación en la sociedad digital

Categorías
New Call-to-action

Qué es data warehouse: funcionamiento, tendencias y ventajas en el cloud

Tiempo de lectura: 5 minutos

Data warehouse es un sistema electrónico que reúne datos de una amplia gama de fuentes dentro de una empresa y utiliza los datos para respaldar la toma de decisiones administrativas. En las siguientes líneas conoceremos qué es data warehouse, cómo funciona, cómo se estructura y qué retos plantea.

¿Qué es data warehouse?

Quienes saben qué es data warehouse tienen claro que se trata de un almacén de datos. Ya se encuentre en los sistemas heredados o en la nube, se considera un repositorio central de datos históricos integrados derivados de sistemas operativos y fuentes de datos externos.

Es, además, el componente central de Business Intelligence, puesto que el Data Warehouse permite a las empresas respaldar una amplia gama de decisiones de negocio, que comprenden, desde la fijación de precios a la expansión o inversión en nuevos métodos de producción.

Además de su función de facilitar el análisis y la elaboración de informes, un data warehouse se asocia a los siguientes usos:

  • Mantener el análisis de datos separado de los sistemas de producción. Las bases de datos operacionales utilizadas diariamente por las empresas no están equipadas para ejecutar consultas analíticas complejas. Data Warehouse permite a las empresas ejecutar dichas consultas sin afectar los sistemas de producción.
  • Entregar consistencia a fuentes de datos dispares. Dado que en el repositorio se produce la integración, independientemente del formato de los datos o de sus fuentes de origen, la información adquiere coherencia y, por eso, quien sabe qué es data warehouse y recurre a él lo hace consciente de que obtendrá una visión única.

La aparición del Cloud Computing ha tenido un impacto significativo en la arquitectura de Data Warehouse, dando lugar a la aparición de los Data Lakes, una versión más sofisticada del tradicional repositorio y del Data Warehouses-as-a-service (DWaaS), que permite optimizar recursos en la nube.

¿Qué es data warehouse y cómo funciona?

La arquitectura tradicional del data warehouse emplea una estructura de tres niveles compuesta por:

  1. Nivel inferior: este nivel contiene el servidor de base de datos utilizado para extraer datos de muchas fuentes diferentes, como las bases de datos transaccionales utilizadas para aplicaciones de usuario.
  2. Nivel medio: el nivel intermedio alberga un servidor OLAP, que transforma los datos en una estructura más adecuada para análisis y consultas complejas. El servidor OLAP puede funcionar de dos maneras: como un sistema de administración de base de datos relacional extendido que mapea las operaciones en datos multidimensionales a operaciones relacionales estándar (OLAP relacional) o utilizando un modelo OLAP multidimensional que implementa directamente las operaciones y los datos multidimensionales.
  3. Nivel superior: el nivel superior es la capa del cliente, al que muchos asocian con lo que es data warehouse. Este nivel contiene las herramientas utilizadas para el análisis de datos de alto nivel, informes de consultas y minería de datos.

En una arquitectura tradicional hay tres modelos comunes de data warehouse: almacén virtual, data mart y data warehouse empresarial. Sus características son la siguientes:

  • Un almacén de datos virtual es un conjunto de bases de datos separadas, que se pueden consultar juntas, de modo que un usuario puede acceder efectivamente a todos los datos como si estuvieran almacenados en un almacén de datos.
  • Un data mart se usa para informes y análisis específicos de línea de negocio. En este modelo de depósito de datos, los datos se agregan a partir de una gama de sistemas fuente relevantes para un área de negocio específica, como ventas o finanzas.
  • El data warehouse empresarial, que es un almacén que contiene datos agregados que abarcan toda la organización. Este modelo considera al almacén de datos como el corazón del sistema de información de la empresa, con datos integrados de todas las unidades de negocio.

¿Qué es data warehouse en la nube?

En los últimos años, los almacenes de datos se están moviendo hacia la nube. Los nuevos almacenes de datos basados ​​en la nube no se adhieren a la arquitectura tradicional; cada oferta de almacén de datos tiene una arquitectura única.

Existen diferentes proveedores de almacenes de datos cloud, pero, para descubrir qué es data warehouse en la nube necesitamos analizarlos y conocer de ellos, al menos, los siguientes datos:

  • Si se trata de infraestructuras que hacen una representación basada en la nube de un data warehouse tradicional.
  • Cómo se almacenan los datos y qué tipo de almacenamiento se ofrece.
  • Si los nodos de procesamiento procesan las consultas en cada segmento simultáneamente.
  • Si con el data warehouse pueden conectar directamente aplicaciones cliente, como las herramientas de BI y analíticas.
  • Qué tipo de datos se pueden cargar.
  • Si las decisiones de administración de recursos están ocultas para el usuario o pueden conocerse.

Yendo un paso más allá del data warehouse, se puede valorar la inversión en una plataforma de gestión del cloud, que ponga a la nube en el centro del negocio, ampliando las capacidades de la empresa, a la vez que dota al negocio de mayor eficiencia y agilidad.

¿Qué es data warehouse y qué retos plantea?

Los almacenes de datos basados ​​en la nube son un gran paso adelante de las arquitecturas tradicionales. Sin embargo, sus usuarios tienen que ser capaces de hacer frente a desafíos relacionados con su configuración, como los siguientes:

  • La carga de datos a los almacenes de datos en la nube requiere la configuración, prueba y mantenimiento de un proceso ETL.
  • Las actualizaciones, sugerencias y eliminaciones pueden ser complicadas y deben hacerse con cuidado para evitar la degradación en el rendimiento de las consultas.
  • Los datos semiestructurados son difíciles de gestionar, es necesario normalizarlos en un formato de base de datos relacional, que requiere automatización para grandes flujos de datos.
  • Las estructuras anidadas generalmente no son compatibles con los almacenes de datos en la nube, por lo que hay que ponerlas en un formato que el almacén de datos pueda comprender.

Además de estos retos, quienes saben qué es data warehouse en la nube tienen claro que, en la práctica, las consultas de usuarios pueden no seguir las mejores prácticas por lo que su ejecución podría demorarse, un inconveniente al que hay que añadir el que tiene que ver con las copias de seguridad y recuperación porque, aunque los proveedores de almacenamiento de datos brindan numerosas opciones, su configuración puede resultar compleja y requerir de supervisión.

Créditos fotográficos: maxkabakov

 

New Call-to-action

Entradas relacionadas

Deja un comentario

No hay comentarios

Todavía no hay ningún comentario en esta entrada.