Analice los datos transaccionales y actúe sobre ellos con un almacén de datos operativos
Resumen
- Los almacenes de datos operativos permiten obtener información útil en tiempo real a partir de datos actualizados.
- Supere las limitaciones de los EDW, los lagos de datos y las soluciones de análisis exclusivamente en la nube.
- Características principales: rápido, escalable, flexible, seguro y casi en tiempo real.
- Actian Analytics Engine ofrece un alto rendimiento gracias al procesamiento vectorizado.
- Admite análisis ad hoc, datos a gran escala y seguridad de nivel empresarial.
Todos hemos oído hablar de cómo las empresas con visión de futuro, tanto pequeñas como grandes, deben centrarse más en el cliente —incluso llegar a estar obsesionadas con él— para tener éxito en este mundo hipercompetitivo. Los datos proporcionan información sobre las necesidades y los comportamientos de tus clientes, lo que te permite adaptar activamente tus mensajes y ofertas para destacar sobre la competencia y ganarte su confianza. Este conocimiento proviene de una variedad cada vez mayor de fuentes disponibles las 24 horas del día, los 7 días de la semana, a través de sistemas digitales y, cada vez más, de un mar de sensores, dispositivos y aplicaciones móviles que registran esas actividades. Pero el volumen de datos puede ser abrumador, y el valor de sus datos puede decaer rápidamente con el tiempo, por lo que es imprescindible contar con una infraestructura que permita explotar rápidamente esa información perecedera para influir en cuándo y cómo interactúa con sus clientes potenciales. Esto requiere un nuevo enfoque para gestionar los datos en tiempo real, lo que denominamos un almacén de datos operativo (ODW). Un ODW puede ir más allá de la generación de informes sobre datos históricos y estáticos y, en su lugar, puede operar con datos frescos y activos para impulsar acciones empresariales específicas, en el momento clave del negocio.
Las empresas ya disponen de una serie de soluciones para proporcionar información analítica, desde sistemas de bases de datos relacionales establecidos hasta almacenes de datos empresariales y lagos de datos, dentro de sus centros de datos o, cada vez más, en la nube. Las soluciones existentes suelen implicar algunos inconvenientes significativos que un almacén de datos operativo puede superar.
Pensemos en el almacén de datos empresarial tradicional, que lleva décadas en uso. Se trata de un método consolidado para gestionar datos históricos, realizar actualizaciones por lotes, dar soporte a ciclos de generación de informes periódicos y servir como fuente única de información veraz para la empresa. Sin embargo, suele ser una solución costosa, especialmente si hay que actualizar el hardware, ampliar la capacidad, añadir nuevos tipos de datos y modernizar el acceso. Un EDW gestionado cuidadosamente por el departamento de TI para garantizar el control y la gestión de los costes requiere que los nuevos informes pasen por un proceso de cambio formal que puede ralentizar el desarrollo. Si bien un EDW gestiona bien las cargas de trabajo planificadas, no es adecuado para consultas ad hoc, lo que dificulta el descubrimiento de datos y la generación de análisis procesables sin afectar a las cargas de trabajo de generación de informes existentes.
Otra opción para algunos es un almacén de datos operativos que proporciona más flexibilidad de datos y un entorno separado para permitir el análisis ad hoc, pero normalmente se centra rígidamente en un área o tipo de datos y no es exhaustivo. Al igual que un EDW, puede no estar optimizado para el rendimiento de las consultas analíticas interactivas necesarias para el descubrimiento.
Los lagos de datos son vistos por muchos como una solución más económica y escalable, con almacenamiento para muchas fuentes y tipos de datos. Sin embargo, pueden convertirse en un vertedero de datos mal gouvernance y validados. Su herencia arquitectónica, diseñada para una ingestion de données fácil y flexible, se traduce a su vez en un rendimiento lento de las consultas, simultanéité usuario deficiente y resultados impredecibles.
El último objeto brillante que ha aparecido es la base de données analytique en la nube, que promete un almacenamiento y un rendimiento económicos y un déploiement elástico sin límites. En realidad, estas soluciones basadas únicamente en la nube pueden dar lugar a costes de computación caros o impredecibles, opciones de déploiement limitadas con un alto potencial de dependencia del proveedor/arquitectura/datos, y una gestión y herramientas relativamente nuevas e inmaduras. ¿Existe una solución mejor?
La solución ideal para el análisis operativo tendría todas las mejores características de las alternativas mencionadas anteriormente sin ninguno de sus defectos. Este nuevo enfoque tendría que ser:
- Rápido - Tendría una arquitectura subyacente optimizada para el rendimiento de las consultas analíticas, que requeriría poco o ningún ajuste en previsión de determinadas cargas de trabajo (como indexación o agregaciones), maximizando la variedad de cargas de trabajo que podría soportar.
- Escalable: escalaría a grandes capacidades de datos con una capa de almacenamiento económica y flexible, conectándose a una variedad de fuentes de datos existentes heredadas y nuevas.
- Flexible - Ofrecería opciones flexibles de déploiement , sur site o en diferentes plataformas en la nube.
- Actual - Sería capaz de realizar actualizaciones casi en tiempo real desde los sistemas operativos para mantenerse al día con el negocio, sin ralentizar el rendimiento de las consultas analíticas en curso.
- Robustez: proporcionaría seguridad, fiabilidad y capacidad de gestión de nivel empresarial.
- Seguro: ofrecería una serie de mecanismos de protección de datos para satisfacer los requisitos de seguridad de las empresas y cumplir con entornos normativos más estrictos.
Estas características definen lo que llamamos un almacén de datos operativo. Con una solución de este tipo, dispondría de un sistema de base de datos capaz de proporcionar información sobre la empresa casi en tiempo real a una gran variedad de usuarios, desde científicos de datos a analistas empresariales. Permitiría el autoservicio ad hoc découverte de données y análisis utilizando los datos operativos más actuales, sin sobrecargar los sistemas transaccionales y las cargas de trabajo.
Actian Analytics Engine se ha diseñado desde cero para ser ese almacén de datos operativo capaz de aprovechar los datos en tiempo real. No solo es rápido, escalable y flexible, sino que está listo para su uso en entornos de producción gracias a sus sólidas funciones de seguridad, administración y gestión de recursos.
El motor es la base de datos analítica más rápida disponible en servidores estándar del sector, tanto en las instalaciones como en la nube. El objetivo inicial era ejecutar código SQL con la misma rapidez que si estuviera escrito en código C optimizado, aprovechando las instrucciones vectorizadas de las CPU estándar, así como un formato de datos columnar para procesar las consultas analíticas de forma más eficiente. Ha logrado ese objetivo y mucho más, acumulando una serie de impresionantes resultados de pruebas de rendimiento que han batido récords en los últimos seis años. Además, Actian Analytics Engine no necesita ajustes de rendimiento especiales ni optimizaciones como la indexación y el ajuste, ya que ofrece un gran rendimiento desde el primer momento. Esto hace que Actian Analytics Engine sea ideal para el descubrimiento de datos ad hoc de autoservicio, con un rendimiento interactivo y tiempos de ciclo reducidos para una iteración más rápida, y sobre conjuntos de datos completos, no muestras.
Actian Analytics Engine ofrece escalabilidad desde un único servidor hasta clústeres de cientos de nodos, utilizando el sistema de archivos distribuido de Hadoop y YARN para gestionar los recursos y distribuir la carga de trabajo allí donde se almacenan los datos. Actian Analytics Engine gestiona desde gigabytes hasta terabytes y petabytes de datos, y se adapta a un número de usuarios simultáneos muy superior al de otras soluciones MPP.
Actian Analytics Engine ha heredado la infraestructura administrativa de los productos RDBMS transaccionales más consolidados de Actian, aprovechando la madurez probada en materia de planificación y optimización de consultas, ingesta de datos, calidad de los datos, seguridad, fiabilidad y facilidad de gestión. Actian DataFlow complementa a la perfección a Actian Analytics Engine al aportar un control más rápido e intuitivo sobre la ingesta de datos y los flujos de trabajo analíticos, incluyendo una interfaz gráfica de usuario basada en KNIME, que facilita la creación y optimización de las cargas de trabajo de consultas.
El análisis puede ofrecer la mejor información a partir de datos actualizados, pero la mayoría de las soluciones analíticas se basan en actualizaciones por lotes y en patrones de acceso de «escribir una vez, leer muchas veces» que no admiten cambios frecuentes. Actian Analytics Engine utiliza una técnica patentada denominada «árboles delta posicionales» para gestionar las actualizaciones de los datos existentes sin afectar al rendimiento de las consultas, lo que permite realizar análisis que incorporan actualizaciones periódicas y frecuentes para ofrecer la información más actualizada sobre su negocio.
Con la entrada en vigor del RGPD, se ha prestado una mayor atención a la privacidad y la seguridad. Las versiones de Actian Analytics Engine incluyen todas las funciones necesarias para garantizar una implementación conforme al RGPD, y las últimas novedades facilitan la administración y el desarrollo de soluciones seguras. Por ejemplo, el enmascaramiento de datos garantiza que solo los usuarios autorizados puedan ver los datos subyacentes, mientras que el resto solo ve un valor enmascarado.
Actian Analytics Engine ofrece una amplia gama de opciones de implementación, ya que se ejecuta en servidores estándar del sector con Linux o Windows, y es compatible con diferentes distribuciones de Hadoop para escalar horizontalmente en clústeres o en infraestructuras en la nube. Vector también admite una amplia variedad de opciones de almacenamiento, lo que reduce cualquier dependencia tecnológica para su almacén de datos operativos.
¡Echa un vistazo hoy mismo a Actian Analytics Engine en AWS Marketplace!