Integración de datos

¿Qué novedades incorpora la versión 6.6.1 de Actian DataFlow?

Corporación Actian

26 de noviembre de 2018

Logotipo de Actian

Actian DataFlow es una plataforma de flujo de trabajo paralelo para el acceso, la transformación, la preparación y el análisis predictivo de datos de extremo a extremo que elimina los cuellos de botella de rendimiento en sus aplicaciones de datos intensivos. Complementario a la base de datos analítica Actian Vector, DataFlow aprovecha simultanéité, el paralelismo y la canalización para acelerar el movimiento de datos entre ubicaciones en su arquitectura de datos, creando resultados más rápidos. DataFlow elimina las limitaciones de memoria, así como la necesidad de mover los datos a almacenes de datos específicos antes de ejecutar los análisis. DataFlow comprende los recursos disponibles antes de dividir la ejecución en trozos más pequeños que pueden ejecutarse en paralelo para aprovechar al máximo el escalado horizontal y vertical.

DataFlow combina el entorno de flujo de trabajo visual de arrastrar y soltar KNIME (plataforma de exploration de données código abierto) con la plataforma subyacente Actian DataFlow para proporcionar un mayor control sobre todo el proceso de lectura de los datos, la realización de las funciones de transformación y análisis, y la escritura de los resultados.

Novedades de la versión 6.6.1

Esta actualización de DataFlow certifica las nuevas versiones de las distribuciones Hadoop más populares de Apache, Cloudera, Hortonworks y MapR, además de mejorar las funciones de carga paralela con las versiones más recientes de Vector para Linux, Windows y Hadoop. También hay soporte para cinco nuevos tipos de datos con DataFlow para manejar una mayor variedad de formatos de datos. He aquí la lista específica:

  • Se ha añadido compatibilidad con Apache Hadoop 3.0.1+.
  • Se ha añadido compatibilidad con MapR 6.0.1.
  • Soporte verificado para MapR 5.2.2.
  • Se ha actualizado la compatibilidad con Hortonworks HDP 2.6.
  • Soporte actualizado para Cloudera CDH 5.15.
  • Actualizado el cargador directo de vectores para que funcione con los últimos Vector y VectorH (5.0 y 5.1).
  • Añadido soporte para 5 nuevos tipos de base: Money, ip4, ip6, uuid, e Intervalos (Periodos y Duraciones).
  • Añadido soporte para la última librería de autenticación de AWS (1.11 previamente 1.3).
  • Añadido soporte para rutas lógicas en Hadoop.

Resultados de DataFlow:

Para la preparación de datos, la incorporación de datos y los casos de uso de ETL, DataFlow puede acelerar el proceso en factores de 20 veces o más. En el caso de un cliente que antes necesitaba 17 horas para preparar y limpiar los datos para incorporar nuevos clientes, DataFlow redujo el tiempo a 43 minutos, casi 24 veces más rápido. Otro cliente utilizó DataFlow para paralelizar y canalizar su proceso de transferencia de datos para reducir sus tiempos de procesamiento de reclamaciones de más de 30 horas a sólo 20 minutos, lo que es 90 veces más rápido. En un tercer ejemplo, DataFlow demostró que podía cargar 500.000 registros en una base de datos Oracle en siete segundos, frente a un tiempo de ejecución anterior de más de 3 minutos. Póngase en contacto con results@actian.com si está interesado en ver una demostración.

logo avatar actian

Acerca de Actian Corporation

Actian hace que los datos sean fáciles. Nuestra plataforma de datos simplifica el modo en que las personas conectan, gestionan y analizan los datos en entornos en la nube, híbridos y locales. Con décadas de experiencia en gestión de datos y análisis, Actian ofrece soluciones de alto rendimiento que permiten a las empresas tomar decisiones basadas en datos. Actian cuenta con el reconocimiento de los principales analistas y ha recibido premios del sector por su rendimiento e innovación. Nuestros equipos comparten casos de uso probados en conferencias (por ejemplo, Strata Data) y contribuyen a proyectos de código abierto. En el blog de Actian, cubrimos temas que van desde la ingestión de datos en tiempo real hasta el análisis impulsado por IA.