Was ist ein Petabyte?

Ein Petabyte (PB) entspricht 1.024 Terabyte oder 1.048.576 Gigabyte.
Wie groß ist ein Petabyte?
Beginnend mit dem kleinsten, soll die folgende Abfolge ein Petabyte im Kontext darstellen:
- Wie groß ist ein Petabyte? In einem Computersystem werden die relativen Größen in Bytes ausgedrückt. Ein Byte besteht aus 8 Bits. Ein einzelnes Bit steht für eine 0 oder eine 1. Beim Schreiben von Anwendungen in Assembler oder Maschinencode verwenden Programmierer hexadezimale Werte, um Byte-Werte auszudrücken. In Hexadezimal wird eine 8-Bit-Zeichenkette mit allen Nullen als x'00 und eine Zeichenkette mit allen Einsen als x'FF geschrieben.
- Bytes werden in der Regel zur Darstellung von Tastenwerten auf einer Tastatur verwendet. Wie diese als Zeichen dargestellt werden, hängt von der geografischen und sprachlichen Region der Tastatur ab. Frühe Personalcomputer mit dem Intel 8080 und Zilog verwendeten einen 8-Bit-Bus, und die CPU verarbeitete 8-Bit-Befehle. Diese Systeme konnten nur 32 KB RAM adressieren.
- Ein Kilobyte (KB) sind 1.024 Bytes. Die Größe einer kleinen Datei kann in KB angegeben werden.
- Megabytes (MB) sind die nächste Einheit des Speichers in einem Computersystem. Ein MB entspricht 1.024 KB. Megabyte wird verwendet, um die Größe einer großen Datei, z. B. einer Bilddatei, zu beschreiben. Die Dateigröße ist wichtig, wenn man ein Bild an eine E-Mail anhängt oder einen Link zu einer größeren Datei weitergibt.
- Ein Gigabyte (GB) entspricht 1.024 Megabyte. Speichermedien mit größerer Kapazität, wie z. B. Speicherkarten, werden in der Regel in Gigabyte angegeben.
- Ein Terabyte (TB) setzt sich aus 1.024 Gigabyte zusammen. Heutzutage wird die Kapazität von Computerfestplatten in Terabyte angegeben. Die Nutzung von Cloud wird in der Regel in Terabyte pro Monat angegeben.
- Ein Petabyte (PB) sind 1.024 TB. Es ist schwer, sich 1.125.899.906.842.624 Bytes vorzustellen. Die Größe einer Serverfarm könnte in Petabytes beschrieben werden.
- Eine Exabyte (EB) sind 1.024 Petabyte. Ein Exabyte ist so groß, dass selbst der gesamte von einem öffentlichen Cloud verwaltete Speicherplatz nur einen Bruchteil eines Exabyte ausmachen würde.
- Ein Zetabyte (ZB) sind 1.024 Exabytes. Alle Daten der Welt sind ein paar Zetabytes.
- Ein Yottabyte (YB) entspricht 1.024 Exabytes.
- Ein Brontobyte (BB) entspricht 1.024 Yottabytes.
- Ein Geopbyte entspricht 1.024 Brontobytes. Diese Zahlen werden in der Astrophysik, der DNA-Forschung und der Kernphysik nützlich.
Datenbank-Speicher
Vor Hadoop verwendeten große Unternehmen kommerzielle Datenbanken vor Ort. Zentralisierte Data Warehouses von Oracle, IBM und Teradata beanspruchten die größten Enterprise Data Warehouses (EDBs). Mit dem Open-Source-Projekt Apache Hadoop wurden kostengünstige geclusterte Datenbanken für kleinere Unternehmen zugänglich, und die Big Data begann. Frühe Hadoop-Implementierungen verwendeten Datenbank-Engines wie Hive, die eine SQL-Schnittstelle zur Abfrage der im Cluster gespeicherten Daten boten, aber sehr langsam waren. Actian Vector wurde schnell zur schnellsten Datenbanktechnologie auf Hadoop-Clustern, da es Daten im Spaltenformat speichert und die Vektorverarbeitung zur Parallelisierung von Abfragen über alle Serverkerne und Serverknoten hinweg nutzt.
In den 1990er Jahren wurde eine Terabyte-Datenbank als Very Large Database (VLDB) bezeichnet und oft für Benchmark-Rekorde in der Transaktionsverarbeitung verwendet. Im Jahr 2010 beanspruchte Facebook den größten klassischen Cluster mit einer Größe von 21 Petabyte und einem Wachstum von einem halben PB pro Tag.
Heute hat sich der Datenbankmarkt weiterentwickelt, um strukturierte und unstrukturierte Daten zu speichern, Anfrage und zu verarbeiten. Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) können Zusammenhänge in riesigen Mengen von Rohdaten finden.
Actian und große Datenbanken
Die Actian Data Platform nutzt eine hochparallele Anfrage , die von der eingebauten Vektorverarbeitungsdatenbank-Engine bereitgestellt wird.
Actian ist ein Pionier in der Datenbankindustrie. Die Ingres-Datenbank war die erste, die mit Ingres-Star eine verteilte Anfrage entwickelte. Heute bietet Ingres Next eine grundsolide Transaktionsdatenbank mit Zeilenspeicher und einer integrierten Erweiterung mit Vertikale Speicherung , die für Data-Warehousing-Abfragen optimiert ist.
Die Actian Data Platform läuft vor Ort und in der Cloud. Die integrierte Datenintegrationstechnologie stellt eine Verbindung zu Hunderten von Datenquellen her. Externe Datenkonnektoren unterstützen den SQL-Zugriff auf Spark-Formate.