Blog | Plateforme de données | | 5 min de lecture

L'endroit où vous effectuez le traitement analytique est important

Traitement analytique

Actian Vector a été rebaptisé Actian Analytics Engine en 2026.


L'offre Vector for Hadoop d'Actian offre des performances accrues pour les requêtes analytiques sans augmentation des coûts. Si vous recherchez de haute performance traitement de haute performance pour soutenir prise de décision opérationnelle, le lieu où vous effectuez ce traitement est déterminant. En réduisant au minimum les transferts de données et en effectuant le traitement localement, vous pouvez réduire considérablement la latence. En utilisant un système tel qu'Actian Analytics Enginepour effectuer ce traitement local, vous pouvez atteindre des niveaux de performance encore plus élevés.

Sur la boîte, dans le centre de données ou à l'autre bout du pays

Lorsque l'on entend dire que "l'endroit où vous effectuez vos traitements est important", la première idée qui vient à l'esprit est la latence du réseau. Il est facile de comprendre comment la transmission de données sur l'internet, à travers le pays ou même à travers la ville, peut ralentir votre traitement. Il en va de même dans votre centre de données. La colocalisation du stockage et de l'informatique à proximité l'un de l'autre (sur le même rack ou même le même appareil) réduit la latence de traitement.

De nombreuses entreprises tirent parti des services en nuage et des systèmes distribués pour améliorer les performances des opérationsOLTP des utilisateur finaux. Lorsqu'il s'agit d'effectuer des analyses, la question de la distance entre à nouveau en jeu. Où devez-vous effectuer votre traitement analytique ? Pour la plupart des entreprises, le cloud est l'endroit idéal pour héberger votre entrepôt de données et effectuer le calcul analytique, car il vous permet de rapprocher vos analyses de vos entrepôts de données et, en même temps, d'exploiter des ressources de calcul à l'échelle du cloud.

En supposant que vous ayez résolu ces problèmes de "grande distance", est-il possible d'optimiser davantage ? Oui, c'est possible. Si le traitement des données en temps réel ou analyses des données en temps réel pour piloter les opérations et la prise de décision sont les objectifs que vous essayez d'atteindre, vous devez porter vos performances analytiques à un niveau supérieur et examiner comment les bases de données et les logiciels que vous utilisez peuvent être optimisés pour tirer le meilleur parti de la capacité des ressources disponibles.

Le disque est lent. La mémoire est meilleure. La mémoire cache est la plus rapide

Examinons ce qui se passe dans un système d'analyse (le matériel et le logiciel que vous utilisez). Ces systèmes sont généralement constitués de trois composants matériels qui ont une influence directe sur les performances : les disques, la mémoire et la mémoire cache des puces. Lorsque vous effectuez des opérations de calcul (qui ne sont en fait qu'un ensemble de formules mathématiques), vous manipulez des données qui sont stockées dans l'un de ces trois endroits. Les puces disposent d'une mémoire cache interne, qui offre les performances les plus rapides mais la capacité la plus faible. Les puces de mémoire RAM ont une plus grande capacité (bien qu'elle soit limitée) et des performances assez rapides parce que les données sont temporairement maintenues dans un état de suspension au lieu d'être écrites sur un support physique, mais beaucoup plus lentes que la mémoire cache des puces. Le stockage sur disque est le plus lent car les données sont écrites sur un support physique (un disque) et lues à partir de ce support physique lorsqu'il est nécessaire d'y accéder. Avec le stockage en nuage, la capacité de disque disponible est pratiquement illimitée.

Les entrepôts de données et les systèmes d'analyse exploitent chacun de ces types de stockage ainsi que la puissance de calcul des processeurs de différentes manières. C'est ce qui confère à Actian Analytics Engine un avantage en termes de performances par rapport aux autres solutions. Analytics Engine optimise l'utilisation de chaque couche de l'infrastructure du système, éliminant ainsi les capacités inutilisées afin de maximiser les performances et de minimiser les coûts. En voici quelques exemples :

Maximiser l'utilisation des cœurs du processeur

Les processeurs modernes sont dotés de plusieurs cœurs, ce qui leur permet d'exécuter plusieurs opérations simultanément. Malheureusement, la plupart des logiciels (y compris les systèmes d'entrepôts de données) ne sont pas conçus pour tirer parti de cette capacité de traitement parallèle ; par conséquent, vous n'utilisez qu'une petite partie de la capacité disponible. La plateforme de données Actian Actian Analytics Engine sont conçus pour exécuter efficacement un grand nombre de requêtes simultanées émises par un grand nombre d'utilisateurs. Les requêtes sont divisées en petits blocs qui peuvent être exécutés en parallèle. C'est important car cela optimise l'utilisation de la processeur dont vous disposez. processeur constituent une capacité limitée dans le temps. Considérez-les comme les heures dont vous disposez chaque jour pour accomplir vos tâches professionnelles. Le défi consiste à utiliser votre capacité disponible de la manière la plus efficace possible et à éviter les temps morts, car une fois le temps écoulé, vous ne pouvez jamais le récupérer.

Réduire la quantité de données écrites et lues sur les disques

Les solutions Actian sont conçues pour une utilisation très efficace des disques - réduisant les opérations d'E/S qui peuvent ralentir le traitement analytique. La plateforme de données Actian est une base de données en colonnes pure. Les bases de données traditionnelles sont basées sur des lignes - les enregistrements sont dans des lignes, et vous devez lire toute la ligne pour effectuer une requête et faire de l'analyse. Actian traite les données comme une série de colonnes - c'est ce qui l'optimise pour le traitement analytique. Parce qu'une colonne de données est constituée du même type de données, les opérations d'analyse peuvent être optimisées. Sous le capot, vous constaterez que chaque colonne est stockée sous forme de fichiers sur le disque avec différents blocs de données. Les index MinMax sur les blocs de données permettent un tri plus rapide des données en aidant la plateforme à identifier plus efficacement les données que l'utilisateur essaie d'analyser et celles qui peuvent être ignorées.

Lorsque vous faites de l'analyse opérationnelle et que vous essayez de prise de décision en temps réel avec des données, vous avez besoin de la meilleure performance possible. En combinant l'augmentation des opérations effectuées à l'aide de la mémoire cache des puces et de la mémoire cache avec un processus plus efficace de gestion des données stockées sur disque, Actian peut optimiser les performances et l'utilisation du matériel de base de données tout en minimisant la quantité de données écrites sur disque. Ces deux points sont importants car ils se traduisent directement par une réduction des coûts d'exploitation. En résumé, il s'agit d'utiliser plus efficacement les ressources dont vous disposez pour atteindre des performances optimales et minimiser les coûts.