Plataforma de datos

Recursos informáticos y de almacenamiento con Actian Data Platform en GKE

Corporación Actian

31 de marzo de 2021

Ordenador frente a almacenamiento

On-Premise, está castigado

La aparición del sistema de archivos distribuidos Hadoop (HDFS) y la posibilidad de crear un lago de datos de una profundidad sin precedentes -¡nada menos que en hardware estándar! - supuso un avance tal que las dificultades administrativas y los costes de hardware que conllevaba la creación de una solución analítica basada en HDFS eran víctimas aceptables de la innovación. Hoy en día, sin embargo, con una herramienta analítica como Actian Data Platform (antes conocida como Avalanche) en contenedores, ejecutándose en la nube y aprovechando Google Kubernetes Engine (GKE), no hay razón para soportar esos dolores. De hecho, dado que Actian en GKE trata la computación y el almacenamiento como recursos independientes, las organizaciones pueden acceder a la potencia de Actian -para satisfacer todas sus necesidades analíticas, tanto en el día a día como en temporada alta- de forma más sencilla y rentable que nunca.

Considérelo: Cuando Hadoop apareció por primera vez, la nube no se consideraba una opción para el análisis de datos. Construir un lago de datos basado en HDFS implicaba añadir servidores y recursos de almacenamiento sur site , lo que también implicaba inversiones en infraestructura auxiliar (redes, equilibradores de carga, etc.), así como personal in situ para gestionar y mantener el creciente número de armarios que se apoderaban del centro de datos. El coste de la información analítica aumentaba aún más por el hecho de que todos estos recursos informáticos y de almacenamiento debían desplegarse teniendo en cuenta los picos de demanda de procesamiento de la organización. No importaba que esos picos sólo se produjeran ocasionalmente -al final del trimestre o durante la ajetreada temporada de compras navideñas-, el clúster que realizaba los análisis tenía que estar preparado para soportar esas demandas cuando llegaran. ¿Mucha de esa potencia de processeur , RAM y espacio de almacenamiento estaban ociosos durante los periodos sin picos? Sí, pero era el precio que había que pagar por un rendimiento fiable durante los periodos de máxima demanda.

Pero el rendimiento en periodos punta no era el único elemento que elevaba el coste de un lago de datos on-prem basado en HDFS. Si la organización necesitaba almacenar grandes cantidades de datos, la naturaleza distribuida de HDFS requería que las organizaciones desplegaran más ressources de calcul para gestionar el almacenamiento adicional, incluso si ya existía un exceso de capacidad de cálculo dentro del clúster analítico más amplio. Además, nadie añadía sólo un poco de almacenamiento al ampliar la capacidad. Incluso si sólo se necesitaban unos pocos GB de almacenamiento adicional, se desplegaba un nuevo servidor con varios terabytes de almacenamiento de alta velocidad, aunque eso significara que se iba a estar creciendo en ese espacio de almacenamiento durante bastante tiempo. Además, cada organización tenía que resolver esto por sí misma, lo que suponía una importante dedicación de recursos informáticos cualificados que podrían emplearse en otra cosa.

Desatar los lazos sobre el terreno

Actian ha roto los vínculos entre computación y almacenamiento. Actian, que se ejecuta en la nube sobre GKE, escala la computación y el almacenamiento de forma independiente, creando grandes oportunidades y, potencialmente, grandes ahorros de costes para las organizaciones que buscan soluciones analíticas flexibles, de haute performance y basadas en la nube.

Ya hemos hablado de las ventajas administrativas de ejecutar Actian Data Platform como una aplicación en contenedores en GKE. Actian se puede implementar más rápida y fácilmente en Google GKE porque todos los componentes están listos para funcionar. No hay scripts de configuración para ejecutar; pilas de aplicaciones para construir en el orden equivocado. Lo que no mencionamos (o al menos ampliamos) en nuestro último blog sobre el tema es que no tiene que configurar Actian en GKE para satisfacer esas demandas de picos de rendimiento. Puede implementar Actian teniendo en cuenta únicamente sus necesidades de rendimiento diarias. Tampoco mencionamos que no necesita aprovisionar almacenamiento para cada nodo trabajador en el clúster.

¿Cómo es posible? Porque los servicios en la nube de Google son altamente elásticos, algo que no se puede decir de la infraestructura de un sur site . Aunque los ressources de calcul asignados inicialmente a un clúster Actian (medidos en unidades Actian, UA) son suficientes para soportar las cargas de trabajo operativas diarias, invariablemente no serán suficientes para ofrecer el rendimiento informático deseado durante los picos de demanda; al fin y al cabo, están configurados para soportar las demandas de tráfico diarias. La elasticidad de la infraestructura de la nube de Google es tal que se pueden añadir UA adicionales al clúster cuando se necesiten. Todo lo que tienes que hacer es escalar las UA para que se ajusten a los niveles de rendimiento deseados y la infraestructura informática de Google se encargará del resto. Más unidades auxiliares significa que se añadirán (o quitarán) más núcleos según sea necesario. Sí, a medida que utilices más potencia de cálculo durante esos periodos punta pagarás más por el uso de esos recursos, pero una gran ventaja de la nube es que, en última instancia, sólo pagas por los ressources de calcul que realmente utilizas. Una vez pasado el pico, se pueden retirar las UA adicionales y los costes volverán a los niveles asociados a las demandas de procesamiento cotidianas.

Del mismo modo, con el almacenamiento, la infraestructura en la nube de Google asignará tanto espacio de almacenamiento como requieran tus datos. Si añades o eliminas datos del sistema, Google aumenta o reduce la cantidad de almacenamiento asignada para tus necesidades, de forma instantánea y automática.

Servir con satisfacción

Esta elasticidad de almacenamiento se convierte en una avantage aún más obvia cuando te das cuenta de que no necesitas desplegar nodos de trabajo HDFS adicionales sólo para gestionar estos datos, incluso si estás ampliando tu base de datos en 4, 40 o 400 TB adicionales. Al igual que con los núcleos de computación añadidos, pagará más por más espacio de almacenamiento - es el mismo modelo de pago por lo que usa - pero debido a que los componentes de almacenamiento y computación se han separado, no es necesario añadir un servidor dedicado para gestionar el almacenamiento por cada TB de almacenamiento que añada. GKE siempre se asegurará de que Actian tenga los ressources de calcul para ofrecer el rendimiento que necesita, puede aumentar y disminuir el número de UAs en función de sus expectativas de rendimiento, no de las limitaciones de una arquitectura de tiempo de ejecución construida con las restricciones on-prem en mente.

Al final, la separación de la computación y el almacenamiento ofrece una enorme ventaja a cualquier persona interesada en el análisis serio. Las grandes empresas pueden reducir sus costes al no tener que sobredimensionar sus infraestructuras locales para dar cabida a las demandas de rendimiento que saben que llegarán. Las empresas más pequeñas pueden construir una infraestructura analítica que antes les hubiera resultado inasequible, ya que tampoco tienen que configurarla para los picos de demanda de rendimiento. Tanto para las grandes como para las pequeñas empresas, Google proporciona los recursos que requieren sus análisis, ni más ni menos, lo que permite a Actian en Google Cloud Platform ofrecer la información analítica que necesita sin arruinarse.

logo avatar actian

Acerca de Actian Corporation

Actian hace que los datos sean fáciles. Nuestra plataforma de datos simplifica el modo en que las personas conectan, gestionan y analizan los datos en entornos en la nube, híbridos y locales. Con décadas de experiencia en gestión de datos y análisis, Actian ofrece soluciones de alto rendimiento que permiten a las empresas tomar decisiones basadas en datos. Actian cuenta con el reconocimiento de los principales analistas y ha recibido premios del sector por su rendimiento e innovación. Nuestros equipos comparten casos de uso probados en conferencias (por ejemplo, Strata Data) y contribuyen a proyectos de código abierto. En el blog de Actian, tratamos temas que van desde la ingesta de datos en tiempo real hasta el análisis basado en IA. Conozca al equipo directivo https://www.actian.com/company/leadership-team/