Actian DataFlow es una plataforma de flujos de trabajo paralelos para el acceso, la transformación, la preparación y el análisis predictivo de datos de extremo a extremo que elimina los cuellos de botella de rendimiento en sus aplicaciones con un uso intensivo de datos. Como complemento del motor analítico de Actian, DataFlow aprovecha la concurrencia, el paralelismo y el procesamiento en serie para acelerar el movimiento de datos entre las distintas ubicaciones de su arquitectura de datos, lo que permite obtener resultados más rápidos. DataFlow elimina las limitaciones de memoria, así como la necesidad de trasladar los datos a almacenes específicos antes de ejecutar los análisis. DataFlow evalúa los recursos disponibles antes de dividir la ejecución en fragmentos más pequeños que se pueden ejecutar en paralelo para aprovechar al máximo el escalado horizontal y vertical.

DataFlow combina el entorno de flujo de trabajo visual de arrastrar y soltar KNIME (plataforma de exploration de données código abierto) con la plataforma subyacente Actian DataFlow para proporcionar un mayor control sobre todo el proceso de lectura de los datos, la realización de las funciones de transformación y análisis, y la escritura de los resultados.

Novedades de la versión 6.6.1

Esta actualización de DataFlow certifica las nuevas versiones de las distribuciones Hadoop más populares de Apache, Cloudera, Hortonworks y MapR, además de mejorar las funciones de carga paralela con las versiones más recientes de Vector para Linux, Windows y Hadoop. También hay soporte para cinco nuevos tipos de datos con DataFlow para manejar una mayor variedad de formatos de datos. He aquí la lista específica:

  • Se ha añadido compatibilidad con Apache Hadoop 3.0.1+.
  • Se ha añadido compatibilidad con MapR 6.0.1.
  • Soporte verificado para MapR 5.2.2.
  • Se ha actualizado la compatibilidad con Hortonworks HDP 2.6.
  • Soporte actualizado para Cloudera CDH 5.15.
  • Se ha actualizado el cargador directo de Vector para que funcione con las últimas versiones de Vector y VectorH (5.0 y 5.1).*
  • Añadido soporte para 5 nuevos tipos de base: Money, ip4, ip6, uuid, e Intervalos (Periodos y Duraciones).
  • Añadido soporte para la última librería de autenticación de AWS (1.11 previamente 1.3).
  • Añadido soporte para rutas lógicas en Hadoop.

*Actian Vector pasó a llamarse Actian Analytics Engine en 2026.

Resultados de DataFlow:

Para la preparación de datos, la incorporación de datos y los casos de uso de ETL, DataFlow puede acelerar el proceso en factores de 20 veces o más. En el caso de un cliente que antes necesitaba 17 horas para preparar y limpiar los datos para incorporar nuevos clientes, DataFlow redujo el tiempo a 43 minutos, casi 24 veces más rápido. Otro cliente utilizó DataFlow para paralelizar y canalizar su proceso de transferencia de datos para reducir sus tiempos de procesamiento de reclamaciones de más de 30 horas a sólo 20 minutos, lo que es 90 veces más rápido. En un tercer ejemplo, DataFlow demostró que podía cargar 500.000 registros en una base de datos Oracle en siete segundos, frente a un tiempo de ejecución anterior de más de 3 minutos. Póngase en contacto con results@actian.com si está interesado en ver una demostración.