¿Qué es la RDD?

¿Qué es la RDD?
El diseño de bases de datos relacionales (RDD) organiza los datos en tablas bidimensionales formadas por filas y columnas. Cada fila de la tabla es un registro, con columnas que son atributos o campos del registro. Una colección de tablas relacionadas se conoce como esquema. El objetivo de este tipo de diseño es permitir un acceso flexible a los datos almacenados en el esquema mediante el Lenguaje de Consulta Estructurado (SQL).
¿Por qué es importante el diseño de bases de datos relacionales?
El proceso de diseño de bases de datos relacionales transforma una función empresarial en un modelo de datos que puede ser gestionado por un sistema de gestión de bases de datos relacionales (RDBMS). El RDBMS almacena datos sobre la función empresarial, lo que facilita el almacenamiento de información transaccional que puede ser recuperada por las aplicaciones y utilizada por soluciones de análisis de datos como los sistemas informatique décisionnelle (BI).
Gracias a su soporte de atomicité cohérence isolement durabilité (ACID), el modelo relacional proporciona a las empresas un sólido procesamiento de transacciones. ACID ofrece las siguientes capacidades:
atomicité
atomicité aplica la regla de todo o nada para proteger la integridad de los datos en un sistema de base de datos relacional. Si una transacción realiza varios cambios, todos ellos se consignan como una unidad. Si algún cambio falla por cualquier motivo, se revierte toda la transacción. Si una transacción está en curso cuando el servidor se bloquea, todas las transacciones no comprometidas se revierten por defecto.
cohérence
cohérence se mantiene rechazando cualquier dato que no coincida con el tipo de datos de un campo, que es una restricción que rige los valores de datos válidos.
isolement
isolement garantiza que cada transacción se ejecute en su propio espacio protegido para que ninguna otra transacción pueda interferir con otra.
durabilité
durabilité protege los cambios comprometidos para garantizar que se escriben en almacenamiento no volátil, de modo que si un servidor falla, las transacciones comprometidas están protegidas.
El proceso de diseño de bases de datos relacionales
A continuación se indican los pasos que sigue un diseñador de bases de datos para asignar una función empresarial a una base de datos relacional.
Modelado de entidades
El primer paso en el proceso de diseño es identificar todas las entidades implicadas en una transacción comercial.
Podemos utilizar como ejemplo una aplicación de gestión de pedidos de venta. Las entidades implicadas en la tramitación de pedidos podrían ser Empleados, Departamentos, Productos, Clientes y Pedidos.
Cada entidad tendrá atributos o detalles sobre ella que son importantes de rastrear. En el caso de un pedido, pueden ser el nombre del cliente, el número de cliente, el ID y la descripción del producto, la cantidad, la fecha del pedido y el importe del artículo.
Es importante saber cómo están conectadas las entidades y si la relación es uno a uno, muchos a uno, uno a muchos, opcional u obligatoria.
Ahora, tenemos suficiente información para crear un modelo Entidad Relación.
Normalización
La normalización elimina los grupos repetidos y organiza el modelo de datos garantizando que cada elemento esté conectado mediante valores de clave primaria y foránea.
Las series de normalización se definen como:
- Primera forma normal.
- Segunda forma normal.
- Tercera forma normal.
- Forma normal de Boyce-Codd.
- Quinta forma normal.
Diseño físico
Podemos pasar a la fase de diseño físico una vez completado el diseño lógico. El esquema de la base de datos se ajusta al modelo totalmente normalizado para un caso de uso centrado en las transacciones. Utiliza un número mínimo de índices para maximizar el rendimiento, ya que la actualización de los índices puede ser lenta.
En un caso de uso analítico de apoyo a la toma de decisiones, los datos pueden desnormalizarse y pueden añadirse índices adicionales. El esquema de una base de datos analítica puede organizarse en forma de estrella o copo de nieve para dar soporte a las consultas más habituales.
Almacenamiento
Las bases de datos relacionales tradicionales almacenan un registro como una fila entera, mientras que las bases de datos orientadas a columnas almacenan las tablas en columnas separadas. Esto tiene la ventaja de almacenar los datos en el orden en que fueron ordenados cuando se cargaron. Suele ser el índice primario natural, lo que minimiza la necesidad de índices. La segunda razón por la que las bases de datos columnares son excelentes para workloads analytiques es que pueden omitir todas las columnas no relacionadas con una consulta, por lo que el conjunto de resultados es mucho más pequeño y es mucho más probable que quepa en la memoria caché.
Actian y las bases de datos relacionales
Actian Data Platform incluye varias bases de datos relacionales, como Actian Vector para workloads analytiques de alta velocidad y Actian Ingres para cargas de trabajo transaccionales. Actian Data Platform se ejecuta sur site y en varias plataformas en la nube, como AWS, Azure y Google Cloud, para que pueda ejecutar sus análisis dondequiera que residan sus datos.