Actian VectorH 5.0 surpasse significativement Impala, Hive et HAWQ dans un récent benchmark.
- Avec la sortie de VectorH 5.0, Actian étend son avance en fournissant aux clients la solution ouverte et prête pour l'entreprise SQL in Hadoop la plus rapide disponible aujourd'hui.
- L'intégration étroite avec Apache Spark ouvre l'accès à de nouvelles sources de données et permet aux développeurs de construire des applications deStreaming, ETL et Machine Learning de de haute performance avec VectorH.
- Actian VectorH 5.0 offre les fonctionnalités de niveau entreprise dont les clients ont besoin pour mettre en production les analyses Hadoop.
PALO ALTO, Californie - 28 juin 2016 - Actian Corporation, leader en matière d'infrastructure d'analyse de données de niveau entreprise, a annoncé aujourd'hui la dernière version de la base de données Actian Vector in Hadoop (VectorH), généralement disponible à la fin du mois de juillet. VectorH est basé sur le même moteur de requête qui alimente Actian Vector, qui a récemment doublé l'enregistrement benchmark TPC-H pour les systèmes non clusterisés au facteur d'échelle de 3000 Go (voir tpc.org/3323).
La capacité à ingérer facilement des informations provenant de différentes sources de données et à développer rapidement des requêtes pour prendre de meilleures décisions commerciales devient de plus en plus importante, en particulier pour les entreprises qui cherchent à répondre aux changements en temps réel ou à explorer l'apprentissage automatique (Machine Learning). Associé à Actian VectorH, la base de données Enterprise SQL la plus rapide du secteur qui s'intègre nativement dans Hadoop, les utilisateurs de Spark disposent d'un nouveau moyen puissant pour aider à tirer une véritable valeur commerciale de leurs données.
" VectorH s'intègre naturellement dans l'architecture Hadoop et offre des performances évolutif de bout en bout ", a déclaré Mark Milani, vice-président senior de l'ingénierie produit chez Actian. "Une intégration plus étroite avec Spark permet à nos clients d'exploiter plus facilement des données de différents formats et de différentes sources, et de profiter des performances d'un moteur de base de données robuste et sécurisé dans VectorH. Nous sommes ravis de proposer cette offre à nos clients. "
L'intégration de Spark est un autre exemple de l'engagement continu d'Actian à incorporer des interfaces et des cadres ouverts directement dans la solution VectorH. Sur le marché Hadoop d'aujourd'hui, l'innovation provient de nombreuses sources et projets différents. Actian VectorH 5.0 s'intègre aux dernières distributions Hadoop de MapR, Cloudera et Hortonworks, et peut être déployé à la fois sur site et dans le nuage. Actian offre à ses clients la flexibilité et le support nécessaires à l'intégration avec d'autres technologies de big data afin de fournir des informations plus rapides et plus riches permettant de prendre de meilleures décisions d'affaires.
VectorH surpasse ses concurrents de plusieurs ordres de grandeur
Le 29 juin, les architectes de Vector présenteront un article à SIGMOD, la première conférence pour les professionnels des bases de données et les universitaires, qui démontre la performance et les capacités supérieures de VectorH 5.0 par rapport à certaines des solutions SQL dans Hadoop les plus populaires : Apache Hive, Cloudera Impala, Apache Spark SQL et Pivotal HAWQ.
Les tests étaient basés sur l'ensemble de requête TPC-H, exécutés sur un cluster de 10 nœuds à l'échelle de 1000 Go, et montrent qu'Actian VectorH a surpassé la concurrence par des ordres de grandeur. L'étude attribue la différence de performance d'Actian VectorH, qui va d'un peu moins de 10X à près de 1000X, à une combinaison de traitement vectoriel de bout en bout, de techniques matures d'optimisation des requête , d'E/S intelligentes et d'algorithmes de compression légers. L'étude a également démontré les capacités de mise à jour rapide et efficace d'Actian VectorH et a identifié les lacunes de la récente tentative de Hive de fournir un support les mises à jour.
La requête testée a été conçue par un organisme industriel pour être représentative d'unecharge de travail support décision ad-hoc de complexité moyenne. Les résultats montrent que VectorH peut exécuter en quelques secondes des requêtes qui prennent jusqu'à 20 minutes à la compétition SQL in Hadoop, même après qu'elles aient été optimisées pour fonctionner au mieux de leurs capacités.
Ressources d'appui :
- Articles de blog d'Actian avec des détails sur les performances.
- Article SIGMOD publié dans les Actes de la Conférence internationale 2016 sur la gestion des données, pages 1105-1117. SIGMOD accepte des articles pour présentation après un examen indépendant par les pairs sur les systèmes, solutions et architectures innovants de gestion des données commerciale gestion des données .
À propos d'Actian :
Actian est un leader de la gestion des données, de l'intégration et de l'infrastructure analytique. Elle propose la plateforme d'analyse big data la plus rapide au monde sur du matériel de base, dans le nuage ou les deux. Avec plus de 10 000 clients dans un large éventail de secteurs, elle aide des marques de premier plan telles que General Electric, Lufthansa, Intuit, Arbor Health et Siemens à relever leurs défis les plus difficiles en matière de données afin de transformer la manière dont elles gèrent et analysent leurs activités. L'entreprise a son siège dans la Silicon Valley et des bureaux dans le monde entier. Restez en contact avec Actian Corporation sur www.actian.com, Facebook, Twitter et LinkedIn.
# # #
Actian, Actian plateforme d'analyse, Actian VectorH et Actian base de données analytique - Vector sont des marques commerciales d'Actian Corporation et de ses filiales. Toutes les autres marques, noms commerciaux, marques de service et logos mentionnés dans le présent document appartiennent à leurs sociétés respectives.