A medida que las empresas se orientan más hacia los datos, los datos que recopilan y almacenan adquieren cada vez más valor. Un proceso empresarial puede ser interno o externalisé, pero los datos y métadonnées que aprovechan definen el negocio. Con el tiempo, los datos que una empresa crea y consume se convierten en su savia y diferenciador competitivo.
gestion des données es la práctica de tratar los datos como un recurso empresarial valioso. Los datos deben gestionarse desde su creación hasta el momento en que dejan de considerarse valiosos. La Asociación de gestion des données (DAMA) es un organismo internacional para profesionales de los datos que tiene una definición formal de la gestion des données: "El desarrollo y la ejecución de arquitecturas, políticas, prácticas y procedimientos para gestionar las necesidades del ciclo de vida de la información de una empresa de forma eficaz". Las funciones empresariales manuales consisten en pasos de procesos con ramas que soportan datos asociados. Las aplicaciones empresariales digitales consisten igualmente en una serie de pasos de proceso con ramas y datos asociados. La diferencia es que los datos del proceso empresarial digital pueden reutilizarse o transformarse inmediatamente para añadir más valor.
Protección de datos
Como los datos son un recurso valioso, hay que protegerlos. A continuación se exponen tres aspectos de la protección de datos:
- En la gestión del almacenamiento, los datos deben protegerse de los fallos de los dispositivos y de las catástrofes naturales para garantizar la continuidad de la actividad. La tecnología RAID puede duplicar los volúmenes de disco para proteger los datos.
- Las políticas y controles de seguridad protegen los datos de la ciberdelincuencia, incluidos el robo y los ataques de ransomware.
- Los sistemas de procesamiento de transacciones y los sistemas de gestión de bases de datos utilizan esquemas de registro de datos y bloqueo de memoria para garantizar que las inserciones y actualizaciones estén protegidas de los cortes de energía y mantener la integridad de los datos. El almacenamiento puede adaptarse a los sistemas transaccionales con tecnología RAID para maximizar el rendimiento mediante la división de los datos en volúmenes físicos.
Gestión del almacenamiento
El valor comercial de los datos puede variar con el tiempo. La variación de un tipo de cambio o de la cotización de una acción es de vital importancia para los operadores cuando cambia, ya que repercute en las transacciones financieras. En cuanto se actualiza el valor de los datos, el valor anterior pierde mucho valor. En los tiempos en que la informática mainframe gobernaba la gestión del almacenamiento, los profesionales utilizaban sistemas de Gestión Jerárquica del Almacenamiento (HSM) para ajustar la selección de soportes de almacenamiento en función del valor de los datos. Los datos utilizados con más frecuencia podían agruparse en el borde interior de los platos de disco para obtener las mejores velocidades de acceso reduciendo la latencia debida al retardo rotacional de los platos de disco giratorios.
El almacenamiento principal de processeur mainframe era muy pequeño en comparación con los estándares actuales, por lo que los discos de estado sólido (SSD) se situaban en la parte superior de la jerarquía de almacenamiento, evitando el tiempo de búsqueda y los retrasos de rotación asociados a los discos giratorios. A continuación, en la jerarquía de rendimiento, se encontraban los cilindros exteriores del almacenamiento en disco, que se utilizaban para almacenar datos menos críticos para el rendimiento. Las utilidades de disco optimizaban periódicamente la ubicación de los datos en los cilindros del disco para minimizar el tiempo de búsqueda del cabezal de lectura en los cilindros. Cuando los datos perdían valor o se enfriaban, se archivaban en volúmenes de cinta magnética. El software de gestión de volúmenes catalogaba lo que se almacenaba en cada volumen de cinta. Los volúmenes de cinta más antiguos se enviaban a archivos externos.
Hoy en día, el almacenamiento basado en la nube tiene un precio en función de la velocidad de acceso. la caché processeur es la más cara. A continuación viene la RAM, seguida del almacenamiento SSD. Los discos giratorios son el nivel de almacenamiento menos costoso. Los gestores de almacenamiento virtual pueden crear volúmenes de disco que no están limitados a la capacidad de un único dispositivo físico y pueden crear bandas y reflejar datos bajo las cubiertas.
Gestión del almacenamiento de un SGBD
Los sistemas de gestión de bases de datos (SGBD) pueden utilizar sistemas de archivos o volúmenes de disco dedicados para gestionar internamente el almacenamiento. Los sistemas de archivos en clúster, como Hadoop HDFS, proporcionan almacenamiento escalable al compartir un conjunto de discos entre varios servidores físicos, lo que los convierte en un repositorio popular para los lagos de datos. Muchos sistemas de gestión de bases de datos son compatibles con clústeres para procesar consultas utilizando varios servidores físicos.
Un DBMS mantendrá los datos más calientes o a los que se accede con más frecuencia en memoria compartida, caché L1, L2 o memoria RAM principal. Para mantener la integridad de los datos, todas las escrituras se realizan en almacenamiento no volátil, como SSD o disco. Las transacciones distribuidas utilizan mecanismos como el commit en dos fases para garantizar que todas las escrituras son atómicas o as-one en múltiples nodos. Los latches de memoria o los mecanismos de semáforo garantizan que no se sobrescriban las escrituras antes de ser enviadas al disco.
Un SGBD realizará un archivado físico a nivel de bloque para mantener una copia de la base de datos para copias de seguridad operativas y recuperación. El administrador de la base de datos también puede exportar datos a nivel de objeto o esquema para crear una copia lógica de un jeu de données de una aplicación. El software de replicación puede utilizar disparadores de bases de datos para interceptar sentencias SQL INSERT, UPDATE y DELETE y enviar las mismas instrucciones a una copia remota de la base de datos. El software de captura de datos de cambios puede utilizarse para gestionar múltiples objetos de base de datos relacionados de forma escalable, normalmente mediante la búsqueda de cambios en los archivos de registro.
Catálogos de datos
La gestion des données se centra menos en el almacenamiento y más en la gouvernance datos, para garantizar que los datos que utiliza una empresa son fiables. El linaje de datos rastrea dónde se originan los datos, y los catálogos rastrean qué aplicaciones y usuarios los consumen. Esto ayuda a reducir el almacenamiento de datos redundantes y promueve la utilidad de los datos. gestion des données gestiona el ciclo de vida de los datos, incluido el uso del almacenamiento y su retirada.
gestion des données con Actian
La dispersión de datos puede eliminarse colocando las capacidades de análisis de datos donde se almacenan los datos. Los datos pueden estar en las instalaciones o en diferentes plataformas en la nube. Actian Data Platform facilita el uso de sus activos de datos dondequiera que residan. Los datos se pueden cargar en un almacén de datos o se puede acceder a ellos como un archivo externo una vez registrados en un almacén de datos. Las consultas analíticas pueden abarcar múltiples instancias dondequiera que residan.