Principales tipos de datos
Existen tres grandes tipos de datos: estructurados, semiestructurados y no estructurados. Los datos pueden tener las siguientes características:
- Los datos primarios proceden de una fuente original, como una báscula.
- Los datos secundarios proceden de una fuente secundaria, como un informe que interpreta los datos originales.
- Los datos cualitativos son subjetivos por naturaleza.
- Los datos cuantitativos son un valor numérico, como una puntuación.
- Los datos discretos son números enteros sin redondear.
- Los datos continuos pueden ser una medida redondeada.
Tipos de datos de Actian
En este artículo, nos centraremos en los tipos de datos a los que pueden acceder los sistemas de gestión de bases de datos (SGBD) de Actian. Estos se dividen en las cinco categorías siguientes:
- Carácter
- Numérico
- Fecha y hora
- Resumen
- Booleano
Datos de carácter
Los tipos de datos de caracteres son cadenas de caracteres ASCII, tanto imprimibles como no imprimibles. Los caracteres alfabéticos en mayúsculas y minúsculas se aceptan literalmente. Los datos de caracteres pueden ser de longitud fija o variable. Las columnas de longitud variable ocupan más espacio que un tipo de longitud fija porque debe almacenarse un especificador de longitud. Si un campo de datos puede contener un valor nulo, se utiliza un byte adicional para almacenar un indicador nulo.
Los espacios en las cadenas de caracteres se tratan como parte de la cadena. Una cadena de longitud fija como CHAR(4) se rellenará con espacios finales como "ABC ". Los espacios en blanco iniciales y finales son significativos cuando se comparan valores.
Al igual que las cadenas CHAR de longitud fija, las cadenas de longitud variable o VARCHAR pueden contener cualquier carácter, incluidos los caracteres no imprimibles, excepto el carácter nulo ASCII, que ocupa un byte adicional si está permitido. Los caracteres en blanco son significativos cuando se almacenan o comparan. Actian Data Platform utiliza los tipos de datos NCHAR y NVARCHAR para almacenar caracteres codificados en UTF8.
Datos JSON
Un ejemplo de tipo de datos semiestructurados es JSON. JSON utiliza su propio tipo de datos. Los valores JSON se almacenan en cualquier columna de cadena, como CHAR, VARCHAR, NCHAR y NVARCHAR. Los valores pueden ser un escalar, arrays o un objeto JSON.
A JSON object is a comma-separated list of key:value pairs surrounded by brackets {}.
Una clave debe ser una cadena entre comillas dobles. Un valor puede ser cualquier valor JSON, incluyendo un objeto JSON o un array JSON. No puede estar en blanco, y los espacios en blanco se ignoran en una cadena de objetos JSON, excepto los espacios en blanco dentro de las comillas dobles de una cadena.
Las cadenas de datos semiestructurados XML y JSON se almacenan como cadenas de longitud variable.
Datos numéricos
Tipos de datos enteros
Los cuatro tipos de datos Entero se utilizan para contener números enteros. Cuantos más bytes utilice el tipo de datos, mayor será el número que pueda contener. Los cuatro tipos de enteros que utiliza la Plataforma de Datos Actian son:
- INTEGER1 o TINYINT (un byte)
- INTEGER2 o SMALLINT (dos bytes)
- INTEGER4 o INTEGER (cuatro bytes)
- INTEGER8 o BIGINT (ocho bytes)
Datos decimales
El tipo de datos decimal almacena números fraccionarios especificando el número total de dígitos y el número de decimales. Por ejemplo, DECIMA(20,5) almacena un número con 20 dígitos de precisión, estando el 5 a la derecha del punto decimal.
Tipo de datos en coma flotante
Los valores de coma flotante pueden expresarse como FLOAT4 para una precisión de cuatro bytes o FLOAT8 para una precisión de 8 bytes. La precisión exacta de los números de 4 bytes depende del procesador. Internamente, los números de ocho bytes se redondean a quince dígitos decimales.
Tipo de datos monetarios
MONEY es un ejemplo de tipo de datos abstracto. Los valores almacenados se redondean a 2 decimales. Los valores deben estar en el rango de $-999,999,999,999.99 a $999,999,999,999.99. El símbolo de moneda es opcional.
Datos de fecha y hora
Timestamp Tipo de datos
El tipo de dato TIMESTAMP se utiliza para registrar cuándo suceden los acontecimientos. Consta de una fecha y una hora, con una zona horaria opcional. Por ejemplo, TIMESTAMP(5) CON ZONA HORARIA podría tener el siguiente aspecto:
2023-15-20 9:30:55.12345-08:00, que estaría en la zona horaria del Pacífico.
Datos abstractos
Tipo de datos booleano
Las columnas BOOLEAN contienen valores literales de 'TRUE' o 'FALSE', que internamente tienen valores de 0 y 1.
Dirección de red IP Tipo de datos
Un tipo de datos abstracto para direcciones IPV4 e IPV6 resulta muy útil a la hora de almacenar y manipular weblogs. Una dirección IPv4 puede tener el siguiente aspecto: 176.12.254.1. La más reciente IPV6 tiene muchas más variaciones, por lo que se parece al siguiente formato: 2101:0cb8:8ca3:0d42:1900:8d2e:0e70:7734.
El uso de datos IPV4 e IPV6 permite comprobar los errores de entrada y admite operadores y funciones especializados.
Identificador único universal (UUID)
Un Identificador Único Universal (UUID) es un identificador único de 128 bits generado por el sistema local a petición o cargado desde fuentes externas. Son adecuados para identificar de forma fiable objetos persistentes a través de una red o generar valores únicos como ID de transacciones.
Datos geoespaciales
La base de datos transaccional Ingres ofrece un amplio soporte para los tipos de datos geoespaciales. Todos los tipos de datos espaciales almacenan características utilizando el formato Well-Known-Binary (WKB), una especificación del Open Geospatial Consortium (OGC).
Los tipos de datos 2D existen en un espacio de coordenadas bidimensional representado por coordenadas X (longitud) e Y (latitud). Entre ellos se incluyen, por ejemplo, la geometría y las cadenas de líneas. Los tipos de datos 3D añaden una tercera dimensión Z en los espacios de coordenadas X, Y y Z. Los datos 4D añaden una cuarta dimensión, dependiente de la aplicación, a una coordenada 3D.
Datos no estructurados
Los datos no estructurados, como el texto, se almacenan en formatos CHAR o VARCHAR en la base de datos. Por lo general, se accede a los datos de vídeo y audio como un objeto almacenado externamente en un sistema de archivos mediante un conector de base de datos como Spark.
Actian y formatos de datos compatibles
Puede obtener más información sobre las bases de datos transaccionales Actian visitando nuestro sitio web.