Arquitectura de datos

No todos los almacenes de datos en la nube son iguales

Corporación Actian

14 de enero de 2020

Almacén de datos en la nube

Existen muchos mitos y conceptos erróneos sobre los almacenes de datos en la nube. Uno de los principales es que todos los almacenes de datos en la nube cuestan lo mismo. A primera vista, los proveedores de entrepôt de données cloud la nube pueden hablar el mismo idioma, describiendo características y ventajas similares y promocionando las mejoras de rendimiento que supone operar en la nube. Pero cuando empiezas a fijarte en los detalles de la implantación, el rendimiento de la migración y la escalabilidad, las diferencias se hacen evidentes.

"Estamos trasladando nuestro almacén de datos a la nube para ahorrar dinero".

Migrar de un almacén de datos sur site a una entrepôt de données cloud données es una excelente forma de obtener un mayor control de sus costes de TI, mejorar el rendimiento y lograr escalabilidad para respaldar su negocio. La magnitud de estas ventajas dependerá de la entrepôt de données cloud que elija y de cómo la implemente. La mayoría de las soluciones de almacén de datos en nube le ofrecen algunas opciones de déploiement : sur site, nube privada, nube pública, multi-nube e híbrida. Si la solución que está considerando no le ofrece estas opciones, es posible que desee hacer una pausa aquí y considerar hasta qué punto confía en la solución que está implementando.

Las opciones de déploiement le ofrecen flexibilidad para cambiar de rumbo en el futuro (y teniendo en cuenta lo rápido que evolucionan los entornos empresariales, la flexibilidad es esencial). Suponiendo que las soluciones que está estudiando ofrezcan las opciones de déploiement estándar, podría asumir que los costes y el rendimiento serán efectivamente los mismos; al fin y al cabo, si se ejecuta en AWS, se trata de la misma infraestructura en la nube, ¿no?

El entorno de la nube, ya sea pública o privada, es sólo una pieza del rompecabezas del rendimiento. La mayoría de los proveedores de nube ofrecen una amplia variedad de capacidades entre las que pueden elegir los proveedores de soluciones de software. El diseño y la configuración de la solución tendrán un impacto significativo en sus costes y en los beneficios de rendimiento que reciba en su implementación. He aquí tres cuestiones clave que debe comprender para saber cómo se las apaña su solución entrepôt de données cloud .

Elasticidad para minimizar el despilfarro y adaptarse a una mayor demanda

Una de las propuestas de valor más significativas de trasladar su almacén de datos a la nube es minimizar el despilfarro que supone la infraestructura infrautilizada y la capacidad ociosa. Los sistemas en la nube están pensados para ampliarse en periodos de máxima demanda y reducirse cuando la capacidad no es necesaria para ahorrar recursos (y costes). Cuando se trata de almacenes de datos en la nube, cada proveedor tiene sus propias capacidades para optimizar la utilización de recursos (oferta) frente al consumo (demanda). Algunas soluciones exigen copias de seguridad completas de las bases de datos para cerrar los servicios y una restauración completa para volver a ponerlos en línea. Esto significa que no es práctico "apagar las luces cuando no se está en la oficina".

Otros entrepôt de données cloud adoptan un enfoque gradual para aumentar la capacidad, añadiendo nuevas instancias cada ocho usuarios aproximadamente. Esto significa que acabas pagando más de lo que realmente necesitas. La clave de la elasticidad y el escalado es tener un control preciso de la capacidad que se utiliza (y por la que se paga) y poder ajustarla a los patrones de uso específicos. Si tiene un mayor control sobre sus costes, podrá minimizar el despilfarro y ahorrar dinero.

Rendimiento - Asegúrese de que entiende lo que obtiene en una "unidad de recursos".

En los centros de datos sur site , es fácil medir qué recursos se utilizan: es este host, esta memoria y estas CPU. ¿Cómo lo sabemos? Porque ese es el hardware en el que se ejecuta mi almacén de datos. En la nube, como la infraestructura se ha optimizado para un uso compartido, los proveedores definen las "unidades de recursos" como una forma de describir la capacidad de manera sencilla. Pero aquí está el truco: no todas las unidades de recursos son iguales, y cada proveedor define su propia unidad de medida. Hay que entender lo que se obtiene en una unidad de recursos en términos de velocidad, rendimiento, escala y tamaño de los recursos. En algunos casos, elementos como la memoria se incluyen en el cálculo; en otros, se miden por separado. Lea la letra pequeña y sepa lo que obtiene.

Eficiencia y procesamiento paralelo

El procesamiento paralelo es uno de los mayores diferenciadores entre las soluciones entrepôt de données cloud . Si se procesan los datos de forma lineal (un registro cada vez), los grandes conjuntos de datos tardan en procesarse. Algunos proveedores aceleran las cosas ejecutando múltiples transacciones en paralelo sobre un conjunto de CPU diferentes. Es más rápido que ir en fila india, pero hay otra opción que es aún más rápida. La vectorización de datos permite ejecutar varias transacciones en un solo ciclo de processeur . Esto significa que se obtiene la velocidad del procesamiento paralelo sin el sobrecoste del hardware paralelo.

Existen muchos mitos sobre los almacenes de datos en la nube, y éste es sólo uno de ellos.

Actian Data Platform

Actian Data Platform se ha diseñado para ofrecer un alto rendimiento y maximizar la eficiencia de la computación, la memoria y el disco, proporcionando análisis de alta velocidad en menos tiempo y a un coste mucho menor que Snowflake.

logo avatar actian

Acerca de Actian Corporation

Actian hace que los datos sean fáciles. Nuestra plataforma de datos simplifica el modo en que las personas conectan, gestionan y analizan los datos en entornos en la nube, híbridos y locales. Con décadas de experiencia en gestión de datos y análisis, Actian ofrece soluciones de alto rendimiento que permiten a las empresas tomar decisiones basadas en datos. Actian cuenta con el reconocimiento de los principales analistas y ha recibido premios del sector por su rendimiento e innovación. Nuestros equipos comparten casos de uso probados en conferencias (por ejemplo, Strata Data) y contribuyen a proyectos de código abierto. En el blog de Actian, tratamos temas que van desde la ingesta de datos en tiempo real hasta el análisis basado en IA. Conozca al equipo directivo https://www.actian.com/company/leadership-team/