Actian VectorH 5.0 supera significativamente a Impala, Hive y HAWQ en una reciente prueba comparativa
- Con el lanzamiento de VectorH 5.0, Actian amplía su liderazgo en el suministro a los clientes de la solución SQL en Hadoop abierta y preparada para empresas más rápida disponible en la actualidad.
- La estrecha integración con Apache Spark abre el acceso a nuevas fuentes de datos y permite a los desarrolladores crear aplicaciones de streaming, ETL y aprendizaje automático de haute performance con VectorH.
- Actian VectorH 5.0 proporciona las funciones de nivel empresarial que los clientes necesitan para poner en producción los análisis de Hadoop.
PALO ALTO, California - 28 de junio de 2016 - Actian Corporation, líder en infraestructura de análisis de datos de nivel empresarial, ha anunciado hoy la última versión de la base de datos Actian Vector in Hadoop (VectorH), disponible de forma general a finales de julio. VectorH se basa en el mismo motor de consulta que impulsa Actian Vector, que recientemente duplicó el récord de referencia TPC-H para sistemas no agrupados en el factor de escala 3000GB (ver tpc.org/3323).
La capacidad de ingerir fácilmente información de diferentes fuentes de datos y desarrollar rápidamente consultas para tomar mejores decisiones de negocio es cada vez más importante, especialmente para aquellas empresas que buscan responder a los cambios en tiempo real o explorar Machine Learning. Cuando se combina con Actian VectorH, la base de datos SQL empresarial más rápida del sector que se integra de forma nativa en Hadoop, los usuarios de Spark disponen de una nueva y potente forma de obtener un verdadero valor empresarial de sus datos.
"VectorH encaja de forma natural en la arquitectura Hadoop y ofrece un rendimiento escalable de extremo a extremo", afirma Mark Milani, vicepresidente senior de Ingeniería de Producto de Actian. "Una integración más estrecha con Spark hace que sea más fácil para nuestros clientes aprovechar los datos en diferentes formatos y de diferentes fuentes, y aprovechar el rendimiento de un motor de base de datos robusto y seguro en VectorH. Estamos entusiasmados de llevar esta oferta a nuestros clientes."
La integración de Spark es otro ejemplo del compromiso continuo de Actian de incorporar interfaces y marcos abiertos directamente en la solución VectorH. En el mercado actual de Hadoop, la innovación proviene de muchas fuentes y proyectos diferentes. Actian VectorH 5.0 se integra con las últimas distribuciones de Hadoop de MapR, Cloudera y Hortonworks, y puede desplegarse tanto sur site como en la nube. Actian proporciona a los clientes la flexibilidad y el soporte necesarios a la hora de integrarse con otras tecnologías de big data para ofrecer una visión más rápida y rica que les permita tomar mejores decisiones empresariales.
VectorH supera a sus competidores en varios órdenes de magnitud
El 29 de junio, los arquitectos de Vector presentarán una ponencia en SIGMOD, la principal conferencia para profesionales y académicos de bases de datos, que demuestra el rendimiento y las capacidades superiores de VectorH 5.0 en comparación con algunas de las soluciones SQL en Hadoop más populares: Apache Hive, Cloudera Impala, Apache Spark SQL y Pivotal HAWQ.
Las pruebas se basaron en el conjunto de consultas TPC-H, ejecutadas en un clúster de 10 nodos a escala de 1000 GB, y muestran que Actian VectorH superó a la competencia en órdenes de magnitud. La investigación atribuye la diferencia de rendimiento de Actian VectorH, que osciló entre poco menos de 10X y casi 1000X, a una combinación de procesamiento vectorial de extremo a extremo, técnicas maduras de optimización de consultas, E/S inteligente y algoritmos de compresión ligeros. La investigación también demostró las capacidades de actualización por goteo rápidas y eficientes de Actian VectorH e identificó deficiencias en el reciente intento de Hive de proporcionar soporte para actualizaciones.
La carga de trabajo de consulta que se probó fue diseñada por un organismo del sector para que fuera representativa de una carga de trabajo ad hoc de apoyo a la toma de decisiones de complejidad media. Los resultados muestran que VectorH puede ejecutar en cuestión de segundos consultas que a la competencia de SQL en Hadoop le llevan hasta 20 minutos, incluso después de haberlas optimizado para que rindan al máximo de su capacidad.
Recursos de apoyo:
- Entradas del blog de Actian con detalles sobre el rendimiento.
- Artículo de SIGMOD publicado en las Actas de la Conferencia Internacional de 2016 sobre Gestión de Datos, páginas 1105-1117. SIGMOD acepta artículos para su presentación tras una revisión por pares independiente sobre sistemas, soluciones y arquitecturas comerciales innovadoras de gestion des données .
Acerca de Actian:
Actian es una empresa líder en infraestructuras de gestion des données, integración y análisis. Ofrece la plateforme d'analyse de big data más rápida del mundo en hardware básico, en la nube o en ambos. Con más de 10.000 clientes en una amplia gama de sectores, ayuda a marcas líderes como General Electric, Lufthansa, Intuit, Arbor Health y Siemens a resolver sus retos de datos más difíciles para transformar la forma en que gestionan y analizan sus negocios. La empresa tiene su sede en Silicon Valley y oficinas en todo el mundo. Manténgase en contacto con Actian Corporation en www.actian.com, Facebook, Twitter y LinkedIn.
# # #
Actian, Actian plateforme d'analyse, Actian VectorH y Actian base de données analytique - Vector son marcas comerciales de Actian Corporation y sus filiales. Todas las demás marcas comerciales, nombres comerciales, marcas de servicio y logotipos a los que se hace referencia en este documento pertenecen a sus respectivas empresas.