Unter Datenmodellierung versteht man die Erstellung einer visuellen Darstellung von Datenelementen und -flüssen im Kontext eines Geschäftsprozesses. Datenmodelle werden erstellt, um zu dokumentieren, wie Daten zur Unterstützung eines Geschäftsprozesses strukturiert sind. Sie können aus bestehenden Datenbankschemata zurückentwickelt werden, um Re-Engineering-Bemühungen zu unterstützen.
Warum Modelldaten?
Datenmodelle sind eine bewährte Methode zur Erstellung eines Basisentwurfs. Die visuelle Darstellung hilft bei der Dokumentation und Kommunikation des Entwurfs mit Prüfern und Mitarbeitern. Sie ist von Vorteil, wenn ein System erweitert werden soll, und sie ist unerlässlich, wenn eine Anwendung auf eine Microservices-Architektur umgestellt wird.
Arten von Datenmodellen
Es gibt mehrere Möglichkeiten, Daten zu modellieren. Im Folgenden finden Sie einige Beispiele:
- Ein Entity-Relationship (ER)-Diagramm ist das gängigste Modell. Es zeigt, wie verschiedene Objekte, die Entitäten darstellen, durch Linien miteinander verbunden sind.
- Ein objektorientiertes Modell eignet sich zur Darstellung von Verbindungen zwischen Objekten, die in einer objektorientierten Datenbank gespeichert werden sollen.
- Ein relationales Modell zeigt, wie Tabellen in einem relationalen Datenbankschema durch Schlüssel miteinander verbunden sind.
- Ein dimensionales Datenmodell ist beim Entwurf eines Star-Schema für ein Data Warehouse nützlich.
- Ein Netzdatenmodell kann zeigen, wie Daten Aufzeichnung strukturiert und verbunden sind.
- Ein Graphenmodell kann Verbindungen zwischen Knoten in einer Graphdatenbank beschreiben.
Die drei Ebenen der Datenmodellierung
Je nachdem, in welchem Stadium der Modellierung Sie sich befinden, kann ein Unternehmen von allen drei Ebenen Nutzen , um Datenbeziehungen zu artikulieren:
- Zu Beginn eines Projekts ist es hilfreich, auf einer hohen Ebene zu skizzieren, welche Daten zur Unterstützung eines Geschäftsprozesses verwendet werden sollen. Das konzeptionelle Datenmodell bietet diese zusammenfassende Sicht auf die Prozesse, die für den Betrieb des Geschäftsprozesses verwendet werden. Auf dieser Ebene wird auf Details verzichtet, damit die Konzepte leicht vermittelt werden können.
- Die meisten Modelle beginnen mit dem logischen Datenmodell des zu implementierenden Geschäftsprozesses. Dieses Modell beschreibt alle Entitäten, ihre Attribute und die Beziehungen zwischen ihnen. Primärschlüsselbeziehungen werden ebenso hervorgehoben wie Fremdschlüsselbeziehungen. Ein Unternehmensanalytiker würde ein solches Datenmodell erstellen.
- Die unterste Ebene ist das physische Datenmodelldas genügend Details enthält, um ein Datenbankschema zu erstellen. Ein Datenbankdesigner oder Anwendungsentwickler würde diese Datenmodellebene zeichnen. Das physische Modell kann auf ein Schema abgebildet werden, das für die jeweilige Datenbanktechnologie geeignet ist. Bei einer relationalen Datenbank kann das physische Modell ein logisches Datenmodell de-normalisieren, um die Leistung für die am häufigsten verwendeten Fragen zu optimieren, die von der Datenbank beantwortet werden sollen. Zu den Schematypen, die ein physischer Entwurf unterstützt, gehören SQL, NoSQL und JSON.
Modellierung von Multiplizitäten
Es gibt mehrere Möglichkeiten, Entitätsbeziehungen darzustellen. Zu den allgemeinen Arten von Beziehungen, die abgebildet werden, gehören:
- Null, eins oder optionale Beziehung.
- Eins-zu-Eins-Beziehung.
- Null oder mehr Beziehungen.
- Eine oder mehrere Beziehungen.
- Eine Beziehung mit begrenzter Reichweite.
Notationen für die Datenmodellierung
Konstrukteure haben die Wahl zwischen verschiedenen Notationsstilen, die sie beim Zeichnen von Modellen verwenden können. Einige der gängigen Stile sind:
- Die IE-Notation ist ein sauberer Stil für High-Level-Datenmodelle. Sie ist einfach, weil sie auf Attributdetails verzichtet.
- Die Barker-Notation kann auf mehreren Ebenen verwendet werden. Sie ist detaillierter als die IE-Notation.
- Die IDEF1X-Notation eignet sich gut für den physischen Datenbankentwurf, ist aber nicht mehr populär.
- Die Object Management Group (OMG) hat einen Modellierungsstandard namens Universal Modeling Language (UML) vorgeschlagen. Bis zur Ratifizierung befindet sich dieser Standard noch im Entwurfsstadium.
Konstruktion eines Modells
Die Erstellung eines Modells umfasst mehrere Schritte und kann mühsam sein. Der Nutzen der einzelnen Schritte besteht darin, ein tiefes Verständnis der Daten und ihrer Zusammenhänge zu entwickeln, das Ihnen hilft, bessere Anwendungen zu erstellen. Die häufigsten Schritte in dieser Reihenfolge sind:
- Verstehen Sie, welche Anwendungsfälle oder Geschäftsprozesse das Modell unterstützen soll.
- Erstellen Sie ein konzeptionelles Modell.
- Verstehen Sie das Datenvolumen und die Fragen, die die Datenbank beantworten muss.
- Erstellen Sie das logische Datenmodell und validieren Sie es auf Vollständigkeit und Genauigkeit.
- Entscheiden Sie, welches Datenbankmodell die Anwendung am besten unterstützt, z. B. SQL, NoSQL oder JSON.
- Normalisierung, Reduzierung von Duplikaten und De-Normalisierung zur Leistungssteigerung.
- Erstellen Sie ein physisches Datenbankmodell.
- Erstellen Sie das Datenbankschema.
- Laden Sie Testdaten und schreiben Sie Abfragen.
- Validieren Sie die Ergebnisse der Anfrage .
- Setzen Sie das Modell ein.
Datenmodellierung mit ActianLösungen
Die Actian Data Platform unterstützt SQL-Datenbankschemata und JSON-Daten. Actian Zen kann für die Bereitstellung von SQL- und NoSQL-Datenbankschemata verwendet werden. Besuchen Sie die ActianWebsite, um zu erfahren, wie unsere Lösungen Menschen bei der Verbindung, Verwaltung und Analyse von Daten helfen.