Arquitectura de datos

Replanteamiento de la arquitectura Medallion para plataformas de datos modernas

Piethein Strengholt

12 de agosto de 2025

Actian-Big Medallion Architecture Debate-Blog

La arquitectura Medallion es un patrón de diseño popular para organizar datos dentro de una arquitectura Lakehouse. Muchas grandes empresas utilizan este patrón para estructurar lógicamente sus datos. 

En este artículo, explicaré a grandes rasgos cómo funciona esta arquitectura, analizaré su adaptabilidad a los entornos empresariales modernos y destacaré por qué sigue siendo relevante, especialmente a medida que los equipos de datos escalan y se federan.

Comprender las tres capas

Capa de bronce

Esta capa actúa como zona de datos brutos recogidos de diversas fuentes. Los datos de la capa Bronce se almacenan en su estructura original sin ninguna transformación, sirviendo como registro histórico y fuente única de verdad. Garantiza que los datos se capturan y almacenan de forma fiable, quedando disponibles para su posterior procesamiento. Sus características clave incluyen un gran volumen, variedad y veracidad. Los datos son inmutables para mantener la integridad de su estado original.

Capa de plata

Esta capa refina, limpia y estandariza los datos brutos, preparándolos para tareas operativas y analíticas más complejas. En esta capa, los datos se someten a comprobaciones de calidad, estandarización, deduplicación y otras mejoras que aumentan su fiabilidad y utilidad. La capa Silver actúa como una etapa de transición en la que los datos siguen siendo granulares pero han sido procesados para garantizar su calidad y coherencia. Sus principales características son que los datos de la capa Silver están más estructurados y son más fáciles de consultar, lo que facilita el trabajo de analistas y científicos de datos.

Capa de oro

Esta capa proporciona datos refinados y optimizados para la toma de decisiones y la obtención de información empresarial específica. La capa Gold consiste en agregar, resumir y enriquecer los datos para facilitar la elaboración de informes y análisis de alto nivel. Esta capa se centra en el rendimiento, la facilidad de uso y la escalabilidad, y proporciona un acceso rápido a métricas y perspectivas clave.

Por qué las capas son lógicas, no físicas

Es fundamental considerar estas capas como lógicas, no físicas. Así, cuando hablemos, por ejemplo, de la capa de Bronce, no la enmarquemos en una sola capa física. En su lugar, considérela una capa lógica que podría abarcar varias capas físicas. A continuación se muestra cómo podría ser la arquitectura Medallion en la práctica:

edificio medallón arquitectura todas las capas

Figura 1 - Construcción de arquitecturas medallón, O'Reilly (2025)

 

Esta flexibilidad conceptual es vital, sobre todo en las grandes organizaciones. A medida que estas organizaciones se expanden, se enfrentan al reto de ampliar la gestión de datos para soportar mayores volúmenes de datos, dar cabida a más usuarios y abordar una mayor variedad de casos de uso.

Arquitectura Medallón Federada

En este contexto, es importante entender que la arquitectura Medallion no debe considerarse un concepto rígido, sino que representa un espectro de posibilidades que pueden adaptarse a circunstancias únicas, incluida la opción de tener múltiples arquitecturas Medallion adaptadas a diferentes necesidades, que pueden influir en el diseño de la arquitectura general.

Por ejemplo, considere la posibilidad de gestionar dos arquitecturas Medallion: una adaptada al sistema de origen y otra al consumo. En este caso, la interacción entre capas resulta crucial. Se podría argumentar que la capa Oro o de producto de datos en la arquitectura alineada con el origen actúa efectivamente como la capa Bronce en la arquitectura alineada con el consumo. Este enfoque crea una arquitectura más racionalizada al eliminar la necesidad de duplicar la capa de producto de datos en la capa Bronce de la configuración de consumo.

La imagen siguiente ilustra un estilo arquitectónico que emplea dos consumidores básicos: un proveedor de datos simple, un proveedor complejo de un solo uso y un consumidor distribuidor.

arquitectura de medallones de edificios diagrama simple del proveedor de datos

Figura 2 - Construcción de arquitecturas medallón, O'Reilly (2025)

Gestión de la complejidad en los equipos

La creación de arquitecturas Medallion puede ser un reto, especialmente cuando participan muchos equipos, cada uno de los cuales necesita acceder a los datos de los demás. En estos casos, puede plantearse establecer arquitecturas Medallion independientes para cada equipo, con sus propias capas Bronce, Plata y Oro.

Sin embargo, ofrecer una buena orientación es esencial para evitar la aparición de demasiadas variaciones, que podrían obstaculizar la interoperabilidad entre ámbitos y crear silos que complicarían el intercambio de datos y la colaboración.

En conclusión, el modelo Medallion no es una solución universal. Sin embargo, sigue siendo uno de los patrones de diseño más prácticos y adaptables para estructurar canalizaciones de datos analíticos y preparados para la IA, especialmente en entornos complejos, federados y en continuo crecimiento.


Para profundizar en estos conceptos, consulte mi libro
Building Medallion Architectures: Designing With Delta Lake and Spark (O'Reilly, 2025)

 

O vea la repetición completa del seminario web:
El gran debate de la arquitectura medallón
Con Ole Olesen Bagneux, Evangelista Jefe de Actian

Piethein Strengholt, retrato

Sobre Piethein Strengholt

Piethein Strengholt es un experto en gestión de datos con amplia experiencia como director de datos (CDO) y arquitecto de datos. Cuenta con una sólida trayectoria colaborando con ejecutivos de CDO en grandes empresas, donde se centra en impulsar el crecimiento de la comunidad y alinear las estrategias con los objetivos de negocio. Piethein también es un bloguero prolífico y un conferenciante muy solicitado que aborda regularmente las últimas tendencias en gestión de datos, incluyendo conceptos de malla de datos, gobernanza de datos y estrategias de escalado.