Gestionar los datos para tomar decisiones a tiempo es todo un reto. Los datos siguen creciendo y se suministran en múltiples formatos. Todavía hay muchos silos de datos que contienen datos que deben integrarse. Ha habido intentos de crear una única fuente de verdad para los datos, la información y el conocimiento que la organización necesita utilizar de forma colaborativa en toda la organización. Las primeras adopciones pueden verse en cómo los sistemas ERP funcionan en múltiples áreas funcionales de una organización. Sin embargo, esto no es suficiente debido al crecimiento y el uso de datos para diversos consumidores de datos.
¿Qué es la arquitectura de concentradores de datos?
Las arquitecturas de concentradores de datos son una recopilación de datos e información de múltiples fuentes dispares para la toma de decisiones específicas de los consumidores. Los datos recopilados pueden residir en cualquier lugar y en cualquier formato. El hub consume los datos necesarios, ayudando a eliminar el ruido de datos y mejorar el rendimiento para la toma de decisiones. Los datos se integran y organizan de forma eficiente, eficaz y económica para respaldar los resultados empresariales funcionales.
Los concentradores de datos pueden consumir datos de diversas fuentes, como los lagos de datos. La arquitectura del concentrador de datos que se construye depende de la comprensión de los consumidores de los datos y las decisiones que deben tomarse, y de las propias fuentes de datos y cómo se relacionan entre sí para las necesidades de la empresa, esencialmente el apoyo a las decisiones empresariales en todas las unidades funcionales.
La arquitectura del centro de datos debe tener en cuenta la cadena de valor entre todas las funciones y las transiciones de datos que se producen entre estas funciones, incluidas las actividades automatizadas de decisión de datos que se encuentran en las capacidades de inteligencia artificial (IA) y aprendizaje automático (ML). El valor final puede concebirse en cuatro áreas únicas para los servicios y productos suministrados, soportados y consumidos. Las cuatro áreas están relacionadas con decisiones de innovación, crecimiento, fijación de clientes y necesidades competitivas de la organización.
Los centros de datos abiertos ayudan a abordar los diferentes criterios de acceso a los datos que necesitan las distintas personas de la organización. Puesto que cada función y rol consume los datos de forma diferente y a veces de la misma manera. Los centros de datos abiertos también contribuyen al uso de infraestructuras de nube híbrida, a la colaboración y a la integración entre varios equipos funcionales. Esto es especialmente cierto para la colaboración entre desarrolladores, científicos de datos e ingenieros de datos.
Las arquitecturas de concentradores de integración de datos ayudan a conectar a través del concentrador de datos múltiples almacenes de datos, independientemente de dónde residan, como en la nube o sur site. Esto ayuda a crear sistemas de registro específicos que son necesarios para aplicaciones particulares de los datos.
Tipos de arquitectura de concentradores de datos
Las arquitecturas de concentradores de datos permiten compartir datos, información y conocimientos mediante la colaboración de productores de datos específicos con consumidores de datos específicos. Esto debe hacerse en forma de cliente o consumidor para que los datos recopilados beneficien al cliente de los mismos. Las arquitecturas de concentradores de datos de clientes deben considerarse como el enfoque que permite el ciclo de vida de los datos de clientes para el apoyo inteligente a la toma de decisiones empresariales. El centro de datos de clientes debe considerarse el epicentro para comprender y responder a las necesidades de los clientes.
Los tipos de arquitecturas de concentradores de datos se basan en los patrones de datos descubiertos que necesitan los consumidores de datos. La arquitectura de un concentrador de datos puede variar de un concentrador a otro en función de las entradas de datos y los consumidores de los mismos. Aunque siguen una estructura básica, como la de hub y spoke, cada arquitectura puede ser muy diferente en cuanto a la forma en que se diseñan los datos para su consumo. No todas las fuentes de datos se copian en el centro, sino sólo las necesarias para las decisiones de los consumidores.
Almacén de datos con arquitectura de eje y radio frente a arquitectura de bus
La arquitectura de datos Hub and Spoke es básicamente un enfoque centralizado para conectar el hub de datos a múltiples entradas o proveedores de datos para varios consumidores de datos. Un Hub puede crearse con una arquitectura Spoke o Bus. Una arquitectura Bus se utiliza para crear un almacén de datos similar a un Hub, pero los datos no tienen una referencia estándar relacionada con los consumidores de los datos. Las arquitecturas Spoke tienden a tener el Hub como punto central de los datos y, por lo tanto, suele ser el punto de referencia estándar. En los casos de uso en los que es necesario un control y una gouvernance estrictos, las empresas tienden a utilizar arquitecturas de radio sobre bus. El bus puede contener todo tipo de datos, pero las aplicaciones son la principal fuente de datos a extraer de la arquitectura de gran almacén de bus. La arquitectura Hub and Spoke para el Data Hub se crea explícitamente para los consumidores. Hub and Spoke se consideran más rápidas debido a la especificidad de los datos contenidos en el hub de datos.
Diagrama de arquitectura del concentrador de datos
El siguiente diagrama de arquitectura de concentrador de datos dicta una perspectiva simple de concentrador y radio entre los datos y el consumidor de datos. La arquitectura puede contener varios concentradores de datos que se ajusten a la finalidad de los consumidores de datos. Esto ayuda al rendimiento y a la comprensión general de cómo se utilizan los datos para tomar decisiones dentro de la organización.
Las entradas al concentrador de datos pueden proceder de almacenes de datos, XML, JSON, Sharepoints, otros silos de datos y cualquier otro lugar donde residan los datos. La consideración crítica aquí es que cuando se construye un concentrador de datos hay que ser específico con la elección de los datos necesarios para las decisiones de los consumidores. De lo contrario, demasiados datos que gestionar disminuirán el rendimiento y aumentarán la complejidad.
Los datos proporcionan respuestas en forma de los propios datos o de su transformación con otros datos en información y conocimiento para el consumidor de los datos. Los consumidores de datos pueden ser personas o fuentes automatizadas como el aprendizaje automático y la inteligencia artificial. En cualquier caso, la organización debe darse cuenta de que la aplicación de un centro de datos es una iniciativa de mejora continua para apoyar resultados empresariales de alto rendimiento.