Qu'est-ce qu'un pétaoctet ?
Un pétaoctet (PB) correspond à 1 024 téraoctets ou 1 048 576 gigaoctets.
Quelle est la taille d'un pétaoctet ?
En commençant par le plus petit, la progression suivante a pour but d'illustrer un pétaoctet dans son contexte :
- Qu'est-ce qu'un pétaoctet ? Dans un système informatique, les tailles relatives sont exprimées en octets. Un octet se compose de 8 bits. Un bit représente un 0 ou un 1. Lorsqu'ils écrivent des applications en assembleur ou en code machine, les programmeurs utilisent des valeurs hexadécimales pour exprimer les valeurs des octets. En hexadécimal, une chaîne de 8 bits contenant tous les zéros s'écrit x'00, et une chaîne contenant tous les uns s'écrit x'FF.
- Les octets sont généralement utilisés pour représenter les valeurs des touches d'un clavier. La façon dont ils sont affichés sous forme de caractères varie en fonction de la région géographique et linguistique du clavier. Les premiers ordinateurs personnels utilisant l'Intel 8080 et le Zilog utilisaient un bus de 8 bits, et le processeur traitait des instructions de 8 bits. Ces systèmes ne pouvaient adresser que 32 Ko de mémoire vive.
- Un kilo-octet (Ko) correspond à 1 024 octets. La taille d'un petit fichier peut être exprimée en Ko.
- Les mégaoctets (Mo) sont l'unité de stockage suivante dans un système informatique. Un mégaoctet correspond à 1 024 Ko. Le mégaoctet est utilisé pour décrire la taille d'un fichier volumineux, tel qu'un fichier image. La taille du fichier est importante lorsqu'il s'agit de joindre une image à un courriel ou de partager un lien vers un fichier plus volumineux.
- Un gigaoctet (Go) correspond à 1 024 mégaoctets. Les dispositifs de stockage de plus grande capacité, tels que les cartes mémoire, sont généralement définis en gigaoctets.
- Un téraoctet (TB) est composé de 1 024 gigaoctets. De nos jours, la capacité des disques durs des ordinateurs est exprimée en téraoctets. L'utilisation du stockage en nuage est généralement exprimée en téraoctets par mois.
- Un pétaoctet (PB) correspond à 1 024 TB. Il est difficile d'imaginer 1 125 899 906 842 624 octets. La taille d'un parc de serveurs peut être décrite en pétaoctets.
- Un exaoctet (EB) correspond à 1 024 pétaoctets. Un exaoctet est si grand que même le stockage total géré par un fournisseur de cloud public ne représente qu'une fraction d'un exaoctet.
- Un zétaoctet (ZB) correspond à 1 024 exaoctets. Toutes les données du monde représentent quelques zétaoctets.
- Un Yottabyte (YB) correspond à 1 024 Exabytes.
- Un Brontobyte (BB) correspond à 1 024 Yottabytes.
- Un géopbyte correspond à 1 024 brontobytes. Ces nombres sont utiles en astrophysique, en recherche sur l'ADN et en physique nucléaire.
Stockage des bases de données
Avant Hadoop, les grandes entreprises utilisaient des bases de données commerciales sur site. Les entrepôts de données centralisés d'Oracle, d'IBM et de Teradata revendiquaient les plus grands entrepôts de données d'entreprise (EDB). Le projet open-source Apache Hadoop a mis les bases de données en cluster à faible coût à la portée des petites entreprises, et le mouvement Big Data a commencé. Les premières implémentations de Hadoop utilisaient des moteurs de base de données tels que Hive, qui fournissaient une interface SQL pour interroger les données stockées sur le cluster, mais qui étaient très lents. Actian Vector est rapidement devenu la technologie de base de données la plus rapide sur les clusters Hadoop grâce à sa capacité à stocker les données dans leur format en colonnes et à utiliser le traitement vectoriel pour paralléliser les requêtes sur tous les cœurs et nœuds de serveurs.
Dans les années 1990, une base de données d'un téraoctet était appelée "Very Large Database" (VLDB) et était souvent utilisée pour établir des records de référence en matière de traitement des transactions. En 2010, Facebook a revendiqué le plus grand Cluster Hadoop classique Cluster Hadoop Big Data Cluster Hadoop , avec une taille de 21 pétaoctets et une croissance d'un demi-po par jour.
Aujourd'hui, le marché des bases de données a évolué pour stocker, requête et exploiter des données structurées et non structurées. L'intelligence artificielle (IA) et l'apprentissage automatique (ML) permettent de trouver des corrélations dans de grandes quantités de données brutes.
Actian et la plate-forme d'intelligence des données
Actian Data Intelligence Platform est conçue pour aider les entreprises à unifier, gérer et comprendre leurs données dans des environnements hybrides. Elle rassemble la gestion des métadonnées , la gouvernance, le lignage, le contrôle de la qualité et l'automatisation en une seule plateforme. Les équipes peuvent ainsi savoir d'où viennent les données, comment elles sont utilisées et si elles répondent aux exigences internes et externes.
Grâce à son interface centralisée, Actian offre une insight en temps réel des structures et des flux de données, ce qui facilite l'application des politiques, la résolution des problèmes et la collaboration entre les services. La plateforme aide également à relier les données au contexte commercial, ce qui permet aux équipes d'utiliser les données de manière plus efficace et plus responsable. La plateforme d'Actian est conçue pour s'adapter à l'évolution des écosystèmes de données, favorisant une utilisation cohérente, intelligente et sécurisée des données dans l'ensemble de l'entreprise. Demandez votre démo personnalisée.