Ressources de calcul et de stockage Avec plateforme de données Actian sur GKE
Actian Corporation
31 mars 2021

Sur site, vous êtes cloué au sol
L'émergence du système de fichiers distribués Hadoop (HDFS) et la possibilité de créer un lac de données d'une profondeur sans précédent - sur du matériel standard qui plus est ! - a constitué une telle percée que les difficultés administratives et les coûts matériels liés à la mise en place d'une solution analytique basée sur HDFS ont été des victimes acceptables de l'innovation. Aujourd'hui, avec un outil analytique comme la plateforme de données Actian (anciennement connue sous le nom d'Avalanche) conteneurisée, fonctionnant dans le cloud et tirant parti de Google Kubernetes Engine (GKE), il n'y a plus de raison de supporter ces douleurs. En effet, comme Actian on GKE traite le calcul et le stockage comme des ressources distinctes, les organisations peuvent accéder à la puissance d'Actian - pour répondre à tous leurs besoins analytiques, tant au quotidien qu'en période de pointe - plus facilement et à moindre coût que jamais auparavant.
Réfléchissez : Lorsque Hadoop est apparu, l'informatique en nuage n'était pas considérée comme une option pour l'analyse des données. La construction d'un lac de données basé sur HDFS impliquait l'ajout de serveurs et de ressources de stockage sur site - ce qui impliquait également des investissements dans des infrastructures auxiliaires (réseaux, équilibreurs de charge, etc.) ainsi que du personnel sur site pour gérer et entretenir le nombre croissant d'armoires qui envahissaient le centre de données. Le coût de l'analyse était encore plus élevé du fait que toutes ces ressources de calcul et de stockage devaient être déployées en tenant compte des pics de demande de traitement de l'organisation. Peu importe que ces pics ne se produisent qu'occasionnellement - à la fin du trimestre ou pendant la période des fêtes de fin d'année - le cluster effectuant les analyses devait être prêt à support ces demandes lorsqu'elles se produisaient. Une grande partie de la puissance du processeur , de la mémoire vive et de l'espace de stockage était-elle inutilisée en dehors des périodes de pointe ? Oui, mais c'était le prix à payer pour obtenir des performances fiables pendant les périodes de pointe.
Mais la performance en période de pointe n'était pas le seul élément qui augmentait le coût d'un lac de données sur site, basé sur HDFS. Si l'organisation devait stocker de grandes quantités de données, la nature distribuée de HDFS l'obligeait à déployer davantage de ressources de calcul pour gérer le stockage supplémentaire - même si la capacité de calcul était déjà excédentaire au sein du cluster analytique plus large. En outre, personne n'ajoutait une petite quantité de stockage lorsqu'il s'agissait d'augmenter la capacité. Même si vous n'aviez besoin que de quelques Go de stockage supplémentaire, vous deviez déployer un nouveau serveur avec plusieurs téraoctets de stockage à grande vitesse, même si cela signifiait que vous alliez utiliser cet espace de stockage sur une longue période. En outre, chaque organisation devait s'en charger elle-même, ce qui entraînait une mobilisation importante de ressources informatiques qualifiées qui pouvaient être utilisées à d'autres fins.
Dénouer les liens sur le terrain
Actian a rompu les liens entre le calcul et le stockage. Actian, qui fonctionne dans le nuage sur GKE, fait évoluer le calcul et le stockage de manière indépendante, créant ainsi de grandes opportunités et potentiellement d'importantes économies pour les organisations qui recherchent des solutions analytiques flexibles, de de haute performance, basées sur le nuage.
Nous avons déjà parlé des avantages administratifs de l'exécution de la plateforme de données Actian en tant qu'application conteneurisée sur GKE. Actian peut être déployé plus rapidement et plus facilement sur Google GKE, car tous les composants sont prêts à l'emploi. Il n'y a pas de scripts de configuration à exécuter, ni de piles d'applications à construire dans le mauvais ordre. Ce que nous n'avons pas mentionné (ou du moins développé) dans notre dernier blogue sur le sujet, c'est qu'il n'est pas nécessaire de configurer Actian sur GKE pour répondre aux demandes de pointes de rendement. Vous pouvez déployer Actian en gardant à l'esprit vos besoins quotidiens en matière de performance. Nous n'avons pas non plus mentionné que vous n'avez pas besoin d'approvisionner le stockage pour chaque nœud de travail dans le cluster.
Comment cela est-il possible ? Parce que les services en nuage de Google sont très élastiques - ce qu'on ne peut pas dire d'une infrastructure sur site . Bien que les ressources de calcul initialement allouées à une grappe Actian (mesurées en unités Actian, UA) soient suffisantes pour support charges de travail opérationnelles quotidiennes, elles ne seront invariablement pas suffisantes pour fournir la performance de calcul souhaitée pendant les pics de demande - elles sont, après tout, configurées pour support demandes de trafic quotidiennes. L'élasticité de l'infrastructure cloud de Google est telle que des unités de calcul supplémentaires peuvent être ajoutées au cluster en cas de besoin. Il vous suffit d'adapter les unités de calcul aux niveaux de performance souhaités et l'infrastructure informatique de Google se chargera du reste. Plus d'unités de calcul signifie que plus de cœurs seront ajoutés - ou soustraits - en fonction des besoins. Certes, si vous utilisez plus de puissance de calcul pendant les périodes de pointe, vous paierez plus cher pour l'utilisation de ces ressources, mais l'un des grands avantages de l'informatique dématérialisée est que vous ne payez en fin de compte que pour les ressources de calcul que vous utilisez réellement. Une fois le pic passé, les UA supplémentaires peuvent être supprimées et vos coûts reviendront aux niveaux associés à vos demandes de traitement quotidiennes.
De même, en ce qui concerne le stockage, l'infrastructure en nuage de Google alloue autant d'espace de stockage que vos données en requièrent. Si vous ajoutez ou supprimez des données du système, Google augmente ou réduit la quantité d'espace de stockage allouée pour vos besoins, instantanément et automatiquement.
Au service de la satisfaction
Cette élasticité du stockage devient un avantage encore plus évident lorsque vous réalisez que vous n'avez pas besoin de déployer des nœuds de travail HDFS supplémentaires pour gérer ces données, même si vous augmentez votre base de données de 4, 40 ou 400 To. Comme pour les cœurs de calcul supplémentaires, vous paierez plus cher pour plus d'espace de stockage - c'est le même modèle de paiement pour ce que vous utilisez - mais parce que les composants de stockage et de calcul ont été séparés, vous n'êtes pas obligé d'ajouter un serveur dédié pour gérer le stockage pour chaque To de stockage supplémentaire. GKE veillera toujours à ce qu'Actian dispose des ressources de calcul nécessaires pour fournir les performances dont vous avez besoin. Vous pouvez augmenter ou diminuer le nombre d'unités de calcul en fonction de vos attentes en matière de performances, et non des limites d'une architecture d'exécution construite en tenant compte des contraintes sur site.
En fin de compte, la séparation du calcul et du stockage offre un énorme avantage à tous ceux qui s'intéressent à l'analyse sérieuse. Les grandes entreprises peuvent réduire leurs coûts en n'ayant pas à surconstruire leurs infrastructures sur site pour répondre aux demandes de performance qu'elles savent venir. Les petites entreprises peuvent mettre en place une infrastructure analytique qui aurait pu être inabordable auparavant, car elles n'ont pas non plus à se configurer pour répondre aux demandes de performances maximales. Pour les grandes comme pour les petites entreprises, Google fournit les ressources dont vos analyses ont besoin - ni plus ni moins - ce qui permet à Actian sur Google Cloud Platform de fournir les informations analytiques dont vous avez besoin sans vous ruiner.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.