Plataforma de datos

El impacto de las actualizaciones en el rendimiento del almacén de datos

Corporación Actian

20 de agosto de 2020

Actualizar la aplicación de software y el concepto de actualización tecnológica del hardware

Cuando las empresas proyectan el crecimiento de su almacén de datos, a menudo se fijan en una curva que imita el crecimiento de los datos en los sistemas de origen. Este enfoque funciona si lo único que le preocupa es el crecimiento del almacenamiento. Lo que no suele tenerse en cuenta es la curva de crecimiento del cálculo para procesar las actualizaciones de los datos. A medida que los sistemas de TI están más interconectados, las actualizaciones de datos en un lugar tienen un efecto dominó, ya que se replican en otros lugares. Su almacén de datos recibe entonces actualizaciones de todas las fuentes de datos afectadas, no sólo del lugar donde se inició el cambio. Si el crecimiento calculado no se planifica ni se tiene en cuenta en la arquitectura e infraestructura del almacén de datos, es probable que el rendimiento se vea afectado.

El efecto bola de nieve en los tiempos de retraso

El rendimiento de un almacén de datos es un aspecto crítico que hay que controlar. Si empieza a retrasarse en el procesamiento de las actualizaciones de datos, el problema empeorará. Tenga en cuenta que las actualizaciones son flujos de datos. Si su almacén de datos sólo es capaz de procesar 9 de cada 10 unidades solicitadas cada segundo, eso significa que 1 unidad va a la cola. Puede que no parezca gran cosa, pero si la situación se prolonga durante 2 minutos, entonces tendrá 120 unidades en la cola y un retraso de 13 segundos. Si la situación persiste durante una hora, habrá 3.600 unidades en la cola y un retraso de 6,6 minutos en el procesamiento. Si la situación se prolonga durante un día laborable, el problema se agrava rápidamente.

¿Por qué es importante?

El rendimiento de los almacenes de datos puede no parecer un gran problema en el contexto de los informes programados y las consultas por lotes. Donde se vuelve problemático es en el contexto de los modernos procesos de negocio "transformados digitalmente" que dependen de los almacenes de datos como punto de agregación para las métricas operativas en tiempo real que abarcan múltiples sistemas de origen. Tomemos, por ejemplo, una planta de fabricación con diferentes líneas de producción. Esta instalación tendrá muchos sensores y maquinaria inteligente que recopilan datos y los transmiten a un almacén de datos donde se combinan con información de suministro de materiales, datos de calidad del producto (procedentes de pruebas) y datos de logística de salida. El almacén de datos permite agregar los datos de todos los sistemas inteligentes en un conjunto de datos de extremo a extremo que puede alimentar los cuadros de mando que los operadores de las instalaciones utilizan para que todo funcione sin problemas. Si los problemas de rendimiento del almacén de datos provocan retrasos en las actualizaciones de los sistemas de origen, los problemas no pueden identificarse ni remediarse en tiempo real, y la empresa pierde la agilidad que necesita para funcionar de forma óptima.

Actian aborda el reto del rendimiento del almacén de datos

La entrepôt de données cloud híbrida entrepôt de données cloud de Actian aborda el reto del rendimiento y minimiza el riesgo de retraso en las actualizaciones de 3 formas clave.

  1. Computación dinámica a escala de la nube. Actian aprovecha la naturaleza flexible de la infraestructura en la nube para ajustar ressources de calcul a las necesidades de procesamiento bajo demanda. Si observa un aumento en las actualizaciones de datos debido al crecimiento de los datos o a un pico, Actian puede ajustar los recursos de infraestructura para proporcionar la capacidad necesaria. No puede hacer esto con una infraestructura de sur site que está limitada por una capacidad de hardware fija.
  2. Procesamiento vectorial. El procesamiento vectorial permite procesar grandes conjuntos de datos de forma más eficiente, reduciendo la carga computacional total del sistema.
  3. Maximización de la utilización del hardware. Actian está diseñado para aprovechar la caché del chip processeur para el procesamiento de ejecución, y cada núcleo processeur disponible para minimizar el desperdicio de infraestructura. La mayoría de los sistemas de almacén de datos no utilizan toda la capacidad disponible processeur y aprovechan la memoria RAM para el procesamiento de ejecución, lo que reduce la capacidad de procesamiento de haute performance .

Al fin y al cabo, la capacidad de su almacén de datos para mantener un alto rendimiento al procesar actualizaciones se reduce a la oferta y la demanda de capacidad informática. En realidad, no puede controlar la demanda de actualizaciones (a menos que quiera desconectar algunos sistemas fuente o ralentizar su negocio). Lo que sí puede controlar es la capacidad de su almacén de datos para procesar estas actualizaciones. Actian proporciona la solución de mayor rendimiento del mercado con una combinación de recursos a escala de la nube, un uso eficiente de los recursos de hardware y un procesamiento vectorizado matriz a matriz. Con Actian, puede dedicar más tiempo a hacer crecer su negocio y menos a preocuparse por si su almacén de datos puede mantener el ritmo.

Para más información, visite www.actian.com/data-platform.

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.