Datenbank-Replikation

Bei Datenbank-Replikation werden mehrere Kopien von Daten erstellt und verwaltet, um deren Zugänglichkeit und Verfügbarkeit zu erhöhen. In der Regel werden dabei Daten aus einer Quelldatenbank in eine oder mehrere andere Datenbanken kopiert, wobei sichergestellt wird, dass alle Daten an allen Standorten identisch sind.
Warum ist Datenbank-Replikation wichtig?
Eine einzige Datenquelle bedeutet, dass es nur einen einzigen Ausfallpunkt gibt, was ein Unternehmen in Gefahr bringen kann. Wenn die Datenbank unzugänglich oder beschädigt wird, gehen die gespeicherten Daten verloren. Regelmäßige vollständige Backups können die Daten bis zum Zeitpunkt des letzten backup wiederherstellen, aber Änderungen, die nach dem backup vorgenommen wurden, können verloren gehen. Datenbank-Replikation beseitigt dieses potenzielle Problem, indem sie mehrere Datenbankkopien zum Schutz der Daten unterhält.
Datenbank-Replikation kann verwendet werden, um regionale Kopien ausgewählter Daten, wie z. B. lokale Preislisten, zu erhalten, so dass die Filialen oder Einrichtungen autonom sind, wenn die Systeme der Zentrale aus irgendeinem Grund ausfallen. Umgekehrt können Daten, die auf regionaler Ebene erstellt wurden, wie z.B. die Verkaufsleistung, in einer zentralen Datenbank repliziert werden, um eine globale Übersicht zu erhalten.
Datenbank-Replikation Anwendungsfälle
Dies sind Möglichkeiten, wie die Datenreplikation Unternehmen Nutzen kann:
Lokaler Datenschutz
Wenn eine zweite Kopie einer Datenbank im selben Rechenzentrum benötigt wird, um z. B. Benutzer bei der Berichterstattung zu unterstützen und die Daten vor Speicherausfällen zu schützen, kann eine synchronisierte Kopie beibehalten werden. Jeder Commit wird dann auf beide Kopien der Datenbank gleichzeitig angewendet.
Geografische Datendistribution
In einem Einzelhandelsszenario benötigt jede Filiale möglicherweise eine Kopie des Master-Produktdatenbankschemas. Wenn in der Zentrale Änderungen an der Master-Kopie vorgenommen werden, erhalten die regionalen Datenbanken die Aktualisierungen asynchron, kurz nachdem die Master-Kopie aktualisiert wurde.
Physische Backups
Eine physische backup einer Datenbank beginnt mit einer backup am Hauptstandort. Der Archivstandort sollte weit genug entfernt sein, um zu verhindern, dass eine Naturkatastrophe oder ein Stromausfall beide Standorte in Mitleidenschaft zieht. Der sekundäre Standort verwaltet die Standby-Datenbank im Wiederherstellungsmodus, wobei archivierte Datenbankprotokolldateien auf die Kopie angewendet werden, sobald sie diese vervollständigen und an den Standby-Standort versandt werden.
Logische Backups
Im Gegensatz zur physischen backup ist eine logische backup offen und für Benutzer mit Lesezugriff für Berichtsfunktionen zugänglich. Zusätzliche Indizes können hinzugefügt werden, um schnellere Abfragen zu unterstützen. Sobald Änderungen in den Protokolldateien der Hauptdatenbank erscheinen, werden sie automatisch an die sekundären Standorte weitergegeben.
Gegenseitiges Standby
Datenbank-Replikation kann so konfiguriert werden, dass zwei Server als Standby-Server füreinander fungieren. In diesem Fall sind beide Server so konfiguriert, dass sie die Kapazität haben, den gesamten Workload zu verarbeiten. Wenn einer der beiden Server ausfällt, wird der verbleibende Server zum Primärserver für den kombinierten Workload.
Verspätete Replikation
Bei dieser ungewöhnlichen Konfiguration gibt es ein sekundäres Replikat einer Datenbank, das ein oder zwei Stunden wartet, bevor es Änderungen vornimmt. Der Grund dafür ist der Schutz vor menschlichem Versagen. So kann ein Administrator beispielsweise versehentlich die falschen Tabellen löschen oder eine für eine Testdatenbank vorgesehene Massenänderung auf ein Produktionssystem anwenden. Dies wird als logische Korruption bezeichnet und kann durch eine verzögerte Kopie verhindert werden.
Multi-Master-Replikation
In einem Multi-Master-Szenario ist jede Datenbank ein Peer der anderen. Wenn in einer Datenbank Änderungen vorgenommen werden, erhalten die anderen Datenbanken genau diese Änderungen über die Replikationssoftware. Im Falle einer zirkulären Aktualisierung oder mehrerer Aktualisierungen derselben Aufzeichnung ist ein regelbasiertes System erforderlich, um Änderungen abzufangen und nur diejenige mit dem neuesten Zeitstempel anzuwenden.
Vorteile der Datenbank-Replikation
Im Folgenden werden einige Hauptgründe für die Replikation einer Datenbank genannt:
- Im Falle eines Netzwerkausfalls eines zentralen Systems ermöglichen regionale Kopien einer Datenbank eine lokale Autonomie.
- Mehrere Datenbankkopien können zum Schutz vor Katastrophen und Cyber-Bedrohungen beitragen, die auf einen einzigen Standort abzielen.
- Wenn ein Festplattenlaufwerk ausfällt, verfügt eine Datenbankkopie zusätzlich zu einem redundanten Array unabhängiger Festplattensysteme (RAID) über eigene Festplattenarrays.
- Verzögerte Kopien einer Datenbank können zum Schutz vor menschlichen Fehlern beitragen. Einige Datenbanksysteme haben zu diesem Zweck eine Rückspulfunktion eingebaut.
Die Actian Datenplattform und Replikation
Die Actian Data Platform bietet eine einheitliche Erfahrung für das Einlesen, Umwandeln, Analysieren und Speichern von Daten. Datenbank-Replikation wird durch den Change Data Capture Bot von Actian Ingres und Actian Vector Datenbanken unterstützt.