El impacto de las actualizaciones en el rendimiento del almacén de datos
Corporación Actian
20 de agosto de 2020

Cuando las empresas proyectan el crecimiento de su almacén de datos, a menudo se fijan en una curva que imita el crecimiento de los datos en los sistemas de origen. Este enfoque funciona si lo único que le preocupa es el crecimiento del almacenamiento. Lo que no suele tenerse en cuenta es la curva de crecimiento del cálculo para procesar las actualizaciones de los datos. A medida que los sistemas de TI están más interconectados, las actualizaciones de datos en un lugar tienen un efecto dominó, ya que se replican en otros lugares. Su almacén de datos recibe entonces actualizaciones de todas las fuentes de datos afectadas, no sólo del lugar donde se inició el cambio. Si el crecimiento calculado no se planifica ni se tiene en cuenta en la arquitectura e infraestructura del almacén de datos, es probable que el rendimiento se vea afectado.
El efecto bola de nieve en los tiempos de retraso
El rendimiento de un almacén de datos es un aspecto crítico que hay que controlar. Si empieza a retrasarse en el procesamiento de las actualizaciones de datos, el problema empeorará. Tenga en cuenta que las actualizaciones son flujos de datos. Si su almacén de datos sólo es capaz de procesar 9 de cada 10 unidades solicitadas cada segundo, eso significa que 1 unidad va a la cola. Puede que no parezca gran cosa, pero si la situación se prolonga durante 2 minutos, entonces tendrá 120 unidades en la cola y un retraso de 13 segundos. Si la situación persiste durante una hora, habrá 3.600 unidades en la cola y un retraso de 6,6 minutos en el procesamiento. Si la situación se prolonga durante un día laborable, el problema se agrava rápidamente.
¿Por qué es importante?
El rendimiento de los almacenes de datos puede no parecer un gran problema en el contexto de los informes programados y las consultas por lotes. Donde se vuelve problemático es en el contexto de los modernos procesos de negocio "transformados digitalmente" que dependen de los almacenes de datos como punto de agregación para las métricas operativas en tiempo real que abarcan múltiples sistemas de origen. Tomemos, por ejemplo, una planta de fabricación con diferentes líneas de producción. Esta instalación tendrá muchos sensores y maquinaria inteligente que recopilan datos y los transmiten a un almacén de datos donde se combinan con información de suministro de materiales, datos de calidad del producto (procedentes de pruebas) y datos de logística de salida. El almacén de datos permite agregar los datos de todos los sistemas inteligentes en un conjunto de datos de extremo a extremo que puede alimentar los cuadros de mando que los operadores de las instalaciones utilizan para que todo funcione sin problemas. Si los problemas de rendimiento del almacén de datos provocan retrasos en las actualizaciones de los sistemas de origen, los problemas no pueden identificarse ni remediarse en tiempo real, y la empresa pierde la agilidad que necesita para funcionar de forma óptima.
Actian aborda el reto del rendimiento del almacén de datos
La entrepôt de données cloud híbrida entrepôt de données cloud de Actian aborda el reto del rendimiento y minimiza el riesgo de retraso en las actualizaciones de 3 formas clave.
- Computación dinámica a escala de la nube. Actian aprovecha la naturaleza flexible de la infraestructura en la nube para ajustar ressources de calcul a las necesidades de procesamiento bajo demanda. Si observa un aumento en las actualizaciones de datos debido al crecimiento de los datos o a un pico, Actian puede ajustar los recursos de infraestructura para proporcionar la capacidad necesaria. No puede hacer esto con una infraestructura de sur site que está limitada por una capacidad de hardware fija.
- Procesamiento vectorial. El procesamiento vectorial permite procesar grandes conjuntos de datos de forma más eficiente, reduciendo la carga computacional total del sistema.
- Maximización de la utilización del hardware. Actian está diseñado para aprovechar la caché del chip processeur para el procesamiento de ejecución, y cada núcleo processeur disponible para minimizar el desperdicio de infraestructura. La mayoría de los sistemas de almacén de datos no utilizan toda la capacidad disponible processeur y aprovechan la memoria RAM para el procesamiento de ejecución, lo que reduce la capacidad de procesamiento de haute performance .
Al fin y al cabo, la capacidad de su almacén de datos para mantener un alto rendimiento al procesar actualizaciones se reduce a la oferta y la demanda de capacidad informática. En realidad, no puede controlar la demanda de actualizaciones (a menos que quiera desconectar algunos sistemas fuente o ralentizar su negocio). Lo que sí puede controlar es la capacidad de su almacén de datos para procesar estas actualizaciones. Actian proporciona la solución de mayor rendimiento del mercado con una combinación de recursos a escala de la nube, un uso eficiente de los recursos de hardware y un procesamiento vectorizado matriz a matriz. Con Actian, puede dedicar más tiempo a hacer crecer su negocio y menos a preocuparse por si su almacén de datos puede mantener el ritmo.
Para más información, visite www.actian.com/data-platform.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.