• Flock of wintering Barnacle Goose(branta leucopsis)in wadden Sea,East Frisia,lower saxony,Germany

#ADNCLOUD

Innovación en la sociedad digital

Categorías
New Call-to-action

Herramientas ETL: comparativa y principales categorías

Tiempo de lectura: 4 minutos

Las herramientas ETL son los instrumentos principales que nos permiten construir un data warehouse o data mart. Sin embargo, no siempre es sencillo saber como elegir la herramienta correcta y que mejor se adapte a nuestros objetivos. En este post se explicarán las distintas categorías de herramientas ETL y se hará una comparativa de las principales herramientas en el mercado.

 

New Call-to-action

¿Qué son las herramientas ETL?

ETL (del inglés extract, transform and load) es el proceso que permite extraer datos de fuentes heterogéneas y con distintos formatos en un único lugar; además, los datos se validan, se limpian y se aplican las transformaciones necesarias para que puedan ser analizados de forma sencilla; finalmente, los datos se cargan en una base de datos, data warehouse o data mart, donde se encuentran listos para ser explotados, según nuestros objetivos de negocio.

Un proceso ETL puede llegar a ser muy complejo, también teniendo en cuenta el elevado tamaño de los datos para extraer, transformar y cargar. Por lo cual, las herramientas ETL juegan un papel fundamental ya que son la base para cualquier estrategia de análisis de datos y de inteligencia de negocio.

Categorías de herramientas ETL

Hay distintas herramientas ETL en el mercado, cada una con sus características concretas. Sin embargo, a la hora de elegir la herramienta adecuada para nuestra empresa o proyecto, nos encontramos frente a cuatro distintas categorías principales:

  • Herramientas ETL Enterprise. Se trata de productos propietarios, con muchas funcionalidades incluidas y soporte para conexión con una gran cantidad de fuentes y suelen ser elegidas por grandes empresas ya que el coste de adquisición es elevado.
  • Herramientas ETL open source. Se trata de herramientas de código libre y de uso gratuito, lo que permite una mayor accesibilidad para empresas de tamaño reducido. Al ser productos con un enfoque general, es necesaria a menudo una personalización para que se adapten a objetivos concretos, lo que requiere consultoría especializada.
  • Herramientas ETL personalizadas. Se trata de herramientas desarrolladas a medida y de forma específica para una empresa o proyecto en concreto. Requieren un grande esfuerzo inicial de desarrollo, pero el resultado se ajusta mejor a los requerimientos.
  • Herramientas ETL Cloud. La nube nos puede proporcionar todas sus ventajas como una alta flexibilidad y el pago por uso a la hora de elegir herramientas ETL que se ofrecen como servicio.

Comparativa de herramientas ETL

Si nos preguntamos cuáles herramientas ETL son mejores, quizás deberíamos antes tener claro para qué nos sirven, ya que cada herramienta tiene sus puntos fuertes que pueden hacer que encaje con nuestro proyecto (y presupuesto). A continuación, vamos a ver las principales características según las cuales es posible realizar una comparativa de herramientas ETL:

  • El coste, que no se limita únicamente el coste de adquisición, sino que también incluye el soporte, la formación y los costes de consultoría. Es importante tener en cuenta el total de estos costes para decidir entre una herramienta propietaria o de código libre.
  • El riesgo de que el proyecto no tenga éxito, lo que incluye no cumplir con el presupuesto, con el calendario o con los requerimientos o expectaciones de los clientes.
  • La facilidad de uso, lo que se mejora de forma sustancial si la herramienta dispone de una interfaz gráfica amigable, lo que puede reducir también el tiempo de aprendizaje.
  • El soporte y la atención al cliente. En este sentido hay que tener en cuenta si se ofrece en varios idiomas y países.
  • Los requerimientos de despliegue de la herramienta, lo que incluye la compatibilidad con las distintas plataformas y sistemas operativos, así como los requisitos de sistema en cuanto a hardware.
  • La velocidad, que depende en larga medida de la cantidad de datos que hay que transferir a través de la red y de la capacidad de cálculo requerida para las transformaciones.
  • La calidad de datos, quizás la característica más importante de las herramientas ETL ya que permite disponer de datos validados y limpios.
  • Herramientas de control, que permiten identificar y solucionar los problemas a lo largo de la fase de desarrollo y después.
  • La conectividad con todo tipo de sistema, lo que nos puede permitir extraer datos de todo tipo de aplicaciones heredadas, sean base de datos, mainframes, ficheros planos, XML, Excel, etc.

Las mejores herramientas ETL

Si queremos saber cuáles son las mejores herramientas ETL, una referencia importante es el Cuadrante Mágico de Gartner, que cada año indica cuáles son los proveedores leader del mercado, entre los cuales se encuentran:

  • Informática: líder según Gartner. Su suite empresarial de integración de datos incluye la solución PowerCenter, una de las más populares.
  • IBM: proporciona la suite de soluciones InfoSphere, en la cual destaca su herramienta DataStage.
  • Talend: conocido por su software de integración de código abierto gratuito Open Studio.
  • SAP: ofrece la herramienta ETL Data Services como parte de SAP BO (Business Objects)
  • SAS: proporciona una solución de integración de datos llamada Data Management
  • Oracle: proporciona la herramienta ELT Data Integrator, que permite gestionar procesos de integración de datos en sistemas de inteligencia de negocio.

Como hemos visto, todas las categorías de herramientas ETL tienen sus ventajas y desventajas. Por lo cual es importante tener en cuenta nuestros objetivos y necesidades, así como los costes y recursos que tenemos a disposición para elegir si adquirir una solución comercial, adaptar una herramienta open source, o desarrollar nuestra propia herramienta.

New Call-to-action

Entradas relacionadas

Deja un comentario

No hay comentarios

Todavía no hay ningún comentario en esta entrada.