synchronisation des données

Les données de SaaS sont plus que des formes et des graphiques sur l'image d'une femme dans la technologie

La technologie de synchronisation des données maintient la cohérence entre les copies de données dans plusieurs référentiels ou applications. La synchronisation des données est un processus continu qui peut être automatisé pour garantir que les changements et les mises à jour sont maintenus dans toutes les copies des données.

Pourquoi la synchronisation des données est-elle importante ?

La conservation de plusieurs copies des données est utile pour la protection des données, la résilience, la conformité, la performance et l'évolutivité. Les copies de données hors site protègent les systèmes critiques contre les défaillances matérielles, les pannes de courant et les catastrophes naturelles en garantissant la disponibilité de données actuelles et exactes.

synchronisation des données Schemes

Il existe différents mécanismes pour répliquer et synchroniser les données. Les approches suivantes permettent de synchroniser les données :

synchronisation des données à une ou deux voies

La synchronisation des données peut être configurée de manière unidirectionnelle ou bidirectionnelle. Toutefois, il faut veiller à éviter les boucles de synchronisation dans une configuration bidirectionnelle.

Fan-In et Fan-Out synchronisation des données

Les données peuvent être synchronisées à partir de nombreuses sources dans un jeu de données consolidé, connu sous le nom de mode "fan-in", ou réparties en éventail à partir d'une source principale vers plusieurs copies cibles. Une gestion minutieuse est nécessaire pour gérer les conflits de données à l'aide d'une approche basée sur des règles, par exemple en donnant la priorité à la copie la plus récente et en évitant de créer des enregistrements en double.

Copies partielles et complètes des données

Les copies intégrales des données sont essentielles pour les scénarios de continuité des activités. Dans une situation où les copies distribuées ne sont utilisées que pour des rapports régionaux, une copie partielle suffira. Prenons l'exemple d'un détaillant national qui regroupe les données de ventes régionales dans un entrepôt de données centralisé au siège, puis distribue des copies localisées aux directeurs de magasins régionaux pour qu'ils puissent obtenir des informations sur leurs magasins.

Copies synchrones de données

Dans de nombreuses applications, telles que la finance, une transaction est incomplète tant que les grands livres source et destination n'ont pas été mis à jour. Dans ce cas, un mécanisme de validation en deux phases garantit que les deux mises à jour du grand livre ont été confirmées avant que la transaction ne soit validée. Dans un scénario en nuage, la copie principale des données est celle qui se trouve dans le nuage, avec une copie secondaire locale. Dans ce cas, la copie dans le nuage est mise à jour en premier et reste en attente jusqu'à ce que la copie locale soit mise à jour. L'inconvénient de maintenir des copies synchrones est la performance car l'application doit attendre les deux mises à jour avant de continuer.

réplication asynchrone

La réplication réplication asynchrone est un bon choix si les copies de données sont distribuées sur un réseau étendu (WAN) ou si les données doivent être distribuées à de nombreuses copies. De nombreux systèmes de réplication utilisent un schéma de publication et d'abonnement dans lequel le dépôt données de base est mis à jour avant que les modifications des données ne soient publiées dans une file d'attente que tous les abonnés peuvent consulter.

Copies physiques des données

Les systèmes de base de données utilisent des sauvegardes opérationnelles physiques contenant les fichiers de base de données, la configuration et les fichiers d'archivage des journaux.

Copies de données logiques

Les copies logiques des données stockées dans une base de données peuvent être un schéma utilisateur qu'un administrateur de bases de données peut exporter vers un fichier plat. Les copies logiques des schémas peuvent être répliquées à l'aide d'un logiciel de réplication tel que High Volume Replicator (HVR). Ce logiciel utilise les fichiers journaux pour insérer et mettre à jour des enregistrements qu'il utilise pour créer des instructions SQL (langage de requête structuré) exécutées dans une copie cible logique à des fins de création de rapports. Cette approche est souvent appelée Change-Data-Capture (CDC).

Une autre forme de copie logique des données peut être créée en transformant le format de fichier lors du déchargement ou de l'exportation d'une table de base de données dans un format de fichier plat, tel qu'un fichier de valeurs séparées par des virgules (.CSV).

Réplication

De nombreux systèmes de base de données permettent d'exécuter une procédure stockée avant ou après la modification d'une table de base de données. Il s'agit des déclencheurs de base de données. Les données peuvent être répliquées à l'aide des déclencheurs. Par exemple, un déclencheur POST INSERT peut créer une copie de l'enregistrement inséré dans une copie distante de cet objet de base de données. Des produits tels que Microsoft OneDrive mettent à jour une copie synchronisée basée sur le nuage d'un fichier du système de fichiers chaque fois qu'il est enregistré ou fermé localement.

Avantages de la synchronisation des données

Vous trouverez ci-dessous les principaux avantages de la synchronisation des données:

  • Élimine la perte de données due à une défaillance de l'appareil.
  • Supprime la vulnérabilité d'une copie unique des données.
  • Fournit une redondance dans un scénario de continuité des activités.

Les défis de la synchronisation des données

Vous trouverez ci-dessous les défis associés au maintien de plusieurs copies de données synchronisées :

  • Augmente la complexité.
  • Ralentit potentiellement une application utilisant l'ensemble de données.
  • Augmente les coûts parce que davantage de ressources en nuage peuvent être consommées ou qu'il faut acquérir des licences pour le logiciel de réplication.

synchronisation des données Utilisation de la plateforme de données Actian

La plateforme de données Actian offre une expérience unifiée pour l'acquisition, la transformation, l'analyse et le stockage des données. Actian s'est associé à HVR Software pour permettre la synchronisation des données.