¿Qué novedades incorpora la versión 6.6.1 de Actian DataFlow?
Corporación Actian
26 de noviembre de 2018

Actian DataFlow es una plataforma de flujo de trabajo paralelo para el acceso, la transformación, la preparación y el análisis predictivo de datos de extremo a extremo que elimina los cuellos de botella de rendimiento en sus aplicaciones de datos intensivos. Complementario a la base de datos analítica Actian Vector, DataFlow aprovecha simultanéité, el paralelismo y la canalización para acelerar el movimiento de datos entre ubicaciones en su arquitectura de datos, creando resultados más rápidos. DataFlow elimina las limitaciones de memoria, así como la necesidad de mover los datos a almacenes de datos específicos antes de ejecutar los análisis. DataFlow comprende los recursos disponibles antes de dividir la ejecución en trozos más pequeños que pueden ejecutarse en paralelo para aprovechar al máximo el escalado horizontal y vertical.
DataFlow combina el entorno de flujo de trabajo visual de arrastrar y soltar KNIME (plataforma de exploration de données código abierto) con la plataforma subyacente Actian DataFlow para proporcionar un mayor control sobre todo el proceso de lectura de los datos, la realización de las funciones de transformación y análisis, y la escritura de los resultados.
Novedades de la versión 6.6.1
Esta actualización de DataFlow certifica las nuevas versiones de las distribuciones Hadoop más populares de Apache, Cloudera, Hortonworks y MapR, además de mejorar las funciones de carga paralela con las versiones más recientes de Vector para Linux, Windows y Hadoop. También hay soporte para cinco nuevos tipos de datos con DataFlow para manejar una mayor variedad de formatos de datos. He aquí la lista específica:
- Se ha añadido compatibilidad con Apache Hadoop 3.0.1+.
- Se ha añadido compatibilidad con MapR 6.0.1.
- Soporte verificado para MapR 5.2.2.
- Se ha actualizado la compatibilidad con Hortonworks HDP 2.6.
- Soporte actualizado para Cloudera CDH 5.15.
- Actualizado el cargador directo de vectores para que funcione con los últimos Vector y VectorH (5.0 y 5.1).
- Añadido soporte para 5 nuevos tipos de base: Money, ip4, ip6, uuid, e Intervalos (Periodos y Duraciones).
- Añadido soporte para la última librería de autenticación de AWS (1.11 previamente 1.3).
- Añadido soporte para rutas lógicas en Hadoop.
Resultados de DataFlow:
Para la preparación de datos, la incorporación de datos y los casos de uso de ETL, DataFlow puede acelerar el proceso en factores de 20 veces o más. En el caso de un cliente que antes necesitaba 17 horas para preparar y limpiar los datos para incorporar nuevos clientes, DataFlow redujo el tiempo a 43 minutos, casi 24 veces más rápido. Otro cliente utilizó DataFlow para paralelizar y canalizar su proceso de transferencia de datos para reducir sus tiempos de procesamiento de reclamaciones de más de 30 horas a sólo 20 minutos, lo que es 90 veces más rápido. En un tercer ejemplo, DataFlow demostró que podía cargar 500.000 registros en una base de datos Oracle en siete segundos, frente a un tiempo de ejecución anterior de más de 3 minutos. Póngase en contacto con results@actian.com si está interesado en ver una demostración.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.