Comment j'ai analysé 165 millions d'enregistrements de vols en quelques secondes sur mon ordinateur portable
Actian Corporation
19 décembre 2017

Il a été étonnamment facile d'analyser 165 millions d'enregistrements de vols sur mon ordinateur portable. Il m'a suffi d'un après-midi pour suivre le guide d'évaluation d'Actian que vous pouvez télécharger ici.
Au fil des ans, les scientifiques d'Intel ont cherché à réduire le coût de l'informatique de de haute performance . La principale caractéristique de la technologie de traitement vectoriel dont ils avaient besoin était d'analyser de grands tableaux de données en un seul cycle d'instruction du processeur . Actian a accéléré les requêtes de base de données SQL standard pour tirer parti de la vectorisation. Actian Vector traduit le SQL standard en algèbre relationnelle, de sorte que vos requêtes peuvent répondre souvent en un centième du temps qu'elles auraient pris avec une base de données relationnelle standard. Depuis que je me suis joint à Actian, j'ai assisté à des démonstrations et entendu des clients vanter les mérites d'Actian Vector, alors j'ai sauté sur l'idée de l'essayer moi-même afin de créer une vidéo pratique. Le guide d'évaluation m'a guidé dans l'installation de la base de données, le chargement d'un échantillon de données et m'a fourni des requêtes à exécuter sur l'ensemble de données de 165 millions de lignes contenant des enregistrements historiques de vols de compagnies aériennes.
Mon ordinateur portable est équipé d'un processeur Intel 64 bits multi-cœur et dispose de 106 Go d'espace disque, ce qui m'a permis d'essayer Vector. Il ne m'a fallu qu'un après-midi pour télécharger le logiciel avec les données de vol brutes, créer la base de données, l'installer, la charger et exécuter les six requêtes fournies. L'étape la plus longue a consisté à décompresser les plus de 300 fichiers CSV contenant les données brutes. Les scripts de chargement fournis créent une table de faits et une table unidimensionnelle. Je n'ai pas créé d'index ni effectué de réglages. J'ai créé les tables et généré des statistiques pour informer l'optimiseur de requête sur les données.
J'ai installé des bases de données, notamment des bases de données relationnelles Oracle, DB/2 et SQL/DS. Jamais il n'a été aussi facile d'atteindre de telles performances. J'ai enregistré l'ensemble du processus et je l'ai édité en une vidéo de sept minutes afin que vous puissiez voir chaque étape par vous-même en cliquant
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.