Bases de datos

¿Qué es la cardinalidad?

asegure su información en un almacén de datos con esquema de base de datos

Cardinalidad en Bases de Datos: Tipos y su importancia

La definición amplia de cardinalidad representa el número de elementos de un conjunto.

¿Qué es la cardinalidad en una base de datos?

En el contexto de una base de datos, la cardinalidad se refiere al número de valores únicos en una columna de una tabla relacional en relación con el número total de filas de la tabla. La cardinalidad de una columna se evalúa y almacena en las tablas del sistema para su uso por parte del optimizador cuando el administrador de la base de datos (DBA) ejecuta las estadísticas.

¿Por qué es importante?

La cardinalidad de una columna es muy importante para los diseñadores de bases de datos y para el optimizador de consultas de bases de datos. Para el diseñador o el administrador de bases de datos, saber que una columna repite principalmente valores le indica que es un mal candidato para un índice, ya que no será muy selectivo. Para un optimizador de consultas basado en costes, la selectividad de un índice potencial dicta si se utilizará o se ignorará. Crear y mantener índices es caro en términos de uso de recursos de processeur y de E/S, por lo que los diseñadores y desarrolladores deben asegurarse de crear índices que se utilicen.

Tipos de cardinalidad en las bases de datos

Los diseñadores de bases de datos establecen el grado de relación entre las entidades. Una entidad puede tener una relación de uno a muchos o de uno a uno con otra entidad. Por ejemplo, un contenedor de almacenamiento puede tener una tapa, lo que constituye una relación uno a uno. Un médico puede tener muchos pacientes, formando una relación de uno a muchos. Esto se conoce como cardinalidad de la relación.

La cardinalidad de los datos se refiere a la unicidad de los valores contenidos en una columna de la base de datos. Si la mayoría de los valores son distintos, se considera que tiene una cardinalidad alta. Si la columna contiene sobre todo valores repetidos, se trata de una columna de cardinalidad baja.

Cuando se particiona una tabla basándose en rangos de valores de datos, una cardinalidad baja puede provocar un sesgo de los datos, lo que resulta en una distribution des données desigual distribution des données entre las particiones. Esto no es bueno porque se quiere equilibrar el uso de recursos en todos los procesadores disponibles, no sólo en un subconjunto.

Cardinalidad alta y baja

Una columna llena de valores distintos se denomina columna de cardinalidad alta. Un número bajo de valores distintos en una columna la convierte en una columna de cardinalidad baja. Cuando se selecciona una columna para indexarla o utilizarla como base para una clave de partición, se buscan candidatos de alta cardinalidad. Del mismo modo, un plan de consulta de base de datos utilizará un índice disponible si una columna contiene valores distintos.

En términos de ajuste del rendimiento de la base de datos, una columna de baja cardinalidad puede dar lugar a una operación de escaneo completo de la tabla, que es la forma más cara (en términos de uso de recursos) de consultar una tabla.

Cardinalidad y modalidad

Cuando se mide el número de asociaciones entre dos o más columnas o filas de una tabla, se utiliza el término cardinalidad. La atención se centra en el número máximo de asociaciones. La modalidad se centra en el número mínimo de relaciones entre entidades o filas de la tabla. La modalidad de una relación es 0 si la relación es opcional, mientras que la modalidad es 1 si la aparición de la relación es obligatoria.

Es hora de facilitar sus datos; visite nuestro sitio web para obtener más información sobre la gama Actian de productos y soluciones de bases de datos.