Tous les entrepôts de données en nuage ne sont pas identiques
Actian Corporation
14 janvier 2020

Les entrepôts de données en nuage font l'objet d'un grand nombre de mythes et d'idées fausses. L'une des plus importantes est que tous les entrepôts de données en nuage coûtent le même prix. À première vue, les fournisseurs d'entrepôt de données cloud nuage parlent le même langage, décrivant des caractéristiques et des avantages similaires et vantant les gains de performance liés à l'exploitation dans le nuage. Mais lorsque vous commencez à examiner les détails de la mise en œuvre, les performances de migration et l'évolutivité, les différences deviennent évidentes.
"Nous déplaçons notre entrepôt de données dans le nuage pour économiser de l'argent.
La migration d'un entrepôt de données sur site vers un entrepôt de données cloud est un excellent moyen de mieux contrôler vos coûts informatiques, d'améliorer les performances et d'atteindre l'évolutivité pour support votre entreprise. L'étendue de ces avantages dépend de l'entrepôt de données cloud que vous choisissez et de la manière dont vous le mettez en œuvre. La plupart des solutions d'entrepôt de données en nuage vous offrent certaines options de déploiement : sur site, nuage privé, nuage public, multi-nuage et hybride. Si la solution que vous envisagez ne vous offre pas ces options, vous devriez peut-être faire une pause et réfléchir à la confiance que vous avez dans la solution que vous êtes en train de mettre en œuvre.
Les choix de déploiement vous donnent la flexibilité nécessaire pour changer de cap à l'avenir (et compte tenu de la rapidité avec laquelle les environnements d'entreprise évoluent, la flexibilité est essentielle). Si les solutions que vous envisagez offrent les options de déploiement standard, vous pouvez supposer que les coûts et les performances seront effectivement les mêmes - après tout, si elles fonctionnent sur AWS, il s'agit de la même infrastructure en nuage, n'est-ce pas ?
L'environnement en nuage, qu'il soit public ou privé, n'est qu'une pièce du puzzle des performances. La plupart des fournisseurs d'informatique en nuage proposent une grande variété de capacités parmi lesquelles les fournisseurs de solutions logicielles peuvent choisir. La conception et la configuration de la solution auront un impact significatif sur vos coûts et sur les avantages en termes de performances que vous obtiendrez lors de votre mise en œuvre. Voici trois points clés que vous devez comprendre pour savoir comment votre solution d'entrepôt de données cloud se comporte.
L'élasticité pour minimiser les déchets et s'adapter à l'augmentation de la demande
L'une des propositions de valeur les plus significatives du transfert de votre entrepôt de données vers le cloud est la minimisation du gaspillage résultant de la sous-utilisation de l'infrastructure et de la capacité inactive. Les systèmes en nuage sont conçus pour être mis à l'échelle pour les périodes de forte demande, puis réduits lorsque la capacité n'est pas nécessaire afin d'économiser des ressources (et des coûts). En ce qui concerne les entrepôts de données en nuage, chaque fournisseur dispose de ses propres capacités pour optimiser l'utilisation des ressources (offre) par rapport à la consommation (demande). Certaines solutions exigent des sauvegardes complètes de la base de données pour arrêter les services et une restauration complète pour remettre le service en ligne. Cela signifie qu'il n'est pas pratique d'"éteindre les lumières lorsque vous n'êtes pas au bureau".
Autres entrepôt de données cloud adoptent une approche progressive pour augmenter la capacité, en ajoutant de nouvelles instances tous les huit utilisateurs environ. Cela signifie que vous finissez par payer pour plus que ce dont vous avez réellement besoin. En matière d'élasticité et d'évolutivité, l'essentiel est de contrôler finement la capacité que vous utilisez (et pour laquelle vous payez) et de pouvoir l'ajuster à la hausse ou à la baisse pour l'adapter à vos habitudes d'utilisation. Si vous avez un meilleur contrôle sur vos coûts, vous pouvez minimiser le gaspillage et économiser de l'argent.
Performance - Assurez-vous de bien comprendre ce que vous obtenez avec une "unité de ressources".
Dans les centres de données sur site , il est facile de mesurer les ressources que vous utilisez : c'est cet hôte, cette mémoire et ces unités centrales. Comment le savons-nous ? Parce que c'est sur ce matériel que tourne mon entrepôt de données. Dans le nuage, l'infrastructure ayant été optimisée pour une utilisation partagée, les fournisseurs définissent des "unités de ressources" qui permettent de décrire la capacité de manière simple. Mais il y a un hic : toutes les unités de ressources ne sont pas égales et chaque fournisseur définit sa propre unité de mesure. Vous devez comprendre ce que vous obtenez dans une unité de ressource en termes de vitesse, de performance, d'échelle et de taille de la ressource. Dans certains cas, des éléments tels que la mémoire sont regroupés avec le calcul ; dans d'autres cas, ils sont mesurés séparément. Lisez les petits caractères et sachez ce que vous obtenez.
Efficacité et traitement parallèle
Le traitement parallèle est l'un des principaux facteurs de différenciation entre les solutions d'entrepôt de données cloud . Si vous traitez les données de manière linéaire (un enregistrement à la fois), le traitement des ensembles de données volumineux prend du temps. Certains fournisseurs accélèrent les choses en exécutant plusieurs transactions en parallèle sur un ensemble de CPU différents. C'est plus rapide que d'utiliser une ligne de fichier unique, mais il existe une autre option encore plus rapide. La vectorisation des données permet d'exécuter plusieurs transactions sur un seul cycle de processeur . Cela signifie que vous bénéficiez de la vitesse du traitement parallèle sans les frais généraux du matériel parallèle.
Les entrepôts de données en nuage font l'objet de nombreux mythes, et celui-ci n'est que l'un d'entre eux.
plateforme de données Actian
plateforme de données Actian est conçu pour des performances élevées et maximise l'efficacité du calcul, de la mémoire et des disques, ce qui permet de réaliser des analyses à grande vitesse en moins de temps et à un coût bien inférieur à celui de Snowflake.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.