• Flock of wintering Barnacle Goose(branta leucopsis)in wadden Sea,East Frisia,lower saxony,Germany

#ADNCLOUD

Innovación en la sociedad digital

Categorías

Tipos de técnicas para el procesamiento de datos

procesamiento de datos
Tiempo de lectura: 3 minutos

De todos es ya sabido que vivimos en la era del big data, las empresas cada vez manejan mayores cantidades datos, y si por un lado debemos de preocuparnos de cómo y dónde almacenar dicha información, por otra parte debemos de tener en cuenta cómo procesar y analizar toda esa cantidad de datos. Por eso, vamos a ver en este artículo cuales son los tipos de técnicas que existen para el procesamiento de datos. La principal diferencia entre los diferentes tipos es sobre todo el tiempo de procesamiento y latencia, por ello dependiendo de las necesidades que se tengan será más favorable uno u otro tipo.

New Call-to-action

Tipos de procesamiento de datos

  • Batch: este tipo de procesamiento también es conocido como procesamiento por lotes. Podemos decir que está basado en la famosa frase «divide y vencerás», lo que hace es dividir en lotes (partes más pequeñas) el gran volumen de datos del que se dispone y los va procesando. Esta tarea puede ser realizada de forma paralela, es decir, se ejecutan varios lotes al mismo tiempo, dependiendo de las características de procesamiento del sistema donde se estén llevando a cabo. Este procesamiento de datos se lleva a cabo gracias a Hadoop y MapReduce. Una de las características a tener en cuenta si usamos procesos batch, es que su duración puede ir de minutos hasta horas, por lo que si necesitamos realizar análisis de datos en tiempo real, esta no es la opción más adecuada. Un ejemplo donde es útil su aplicación, sería cuando queremos obtener informes de ciertos periodos de tiempo, donde hay gran volumen de información que procesar, como podría ser las ventas anuales de una empresa. En este caso, ejecutar el informe y que tarde algunos minutos en generarse, podría ser totalmente entendible, ya que es una acción puntual que no necesita de una respuesta inmediata.
  • Streaming: como evolución a los procesos por bloques que veíamos en el punto anterior, surge el procesamiento de datos en tiempo real o en streaming. Este tipo de técnica procesa los datos de manera mucho más rápida, ya que estos son gestionados justo en el instante en el que se crean, antes incluso de llegar al dispositivo de almacenamiento. Si con el procesamiento batch se trabajaba sobre bloques enormes de datos, en stream solo se procesan los datos más recientes. La latencia o tiempo de respuesta en estos casos es mínima, de segundos o tan solo milisegundos. Un ejemplo de uso de este tipo de procesamiento, sería en un call center de una sucursal bancaria, donde llama un cliente y con tan solo introducir su DNI en el sistema, en unos segundos se tiene toda su información en pantalla.
  • Lambda: esta arquitectura es una mezcla que aúna lo mejor de los procesos batch o por bloques y lo mejor del procesamiento en tiempo real; es la tecnología más reciente en aparecer en el proceso de grandes volúmenes de datos.

Seguramente en poco tiempo aparecerán nuevas técnicas y arquitecturas para procesar los datos cada vez a mayor velocidad, ya que el volumen de información con el que trabajan las empresas no para de aumentar, y es fundamental encontrar herramientas que sean capaces de soportar y sacar el máximo partido del big data.

New Call-to-action

Entradas relacionadas

Deja un comentario

No hay comentarios

Todavía no hay ningún comentario en esta entrada.