¿Qué es un petabyte?

Qué es un petabyte

Un Petabyte (PB) equivale a 1.024 Terabytes o 1.048.576 Gigabytes.

¿Qué tamaño tiene un petabyte?

Empezando por el más pequeño, la siguiente progresión pretende describir un Petabyte en su contexto:

  • ¿Cuánto es un petabyte? En un sistema informático, los tamaños relativos se expresan en Bytes. Un byte consta de 8 bits. Un solo bit representa un 0 o un 1. Al escribir aplicaciones en ensamblador o código máquina, los programadores utilizan valores hexadecimales para expresar los valores de los bytes. En hexadecimal, una cadena de 8 bits con todos ceros se escribe como x'00,' y una cadena con todos unos se escribe como x'FF.'
  • Los bytes se utilizan habitualmente para representar los valores de las teclas de un teclado. La forma en que éstos se muestran como caracteres cambia según la región geográfica y el idioma del teclado. Los primeros ordenadores personales que utilizaban el Intel 8080 y el Zilog empleaban un bus de 8 bits, y el processeur procesaba instrucciones de 8 bits. Estos sistemas sólo podían direccionar 32 KB de RAM.
  • Un kilobyte (KB) equivale a 1.024 bytes. El tamaño de un archivo pequeño puede expresarse en KB.
  • Los megabytes (MB) son la siguiente unidad de almacenamiento en un sistema informático. Un MB equivale a 1.024 KB. El megabyte se utiliza cuando se describe el tamaño de un archivo grande, como un archivo de imagen. El tamaño de un archivo es importante cuando se adjunta una imagen a un correo electrónico o se comparte un enlace a un archivo más grande.
  • Un Gigabyte (GB) equivale a 1.024 Megabytes. Los dispositivos de almacenamiento de mayor capacidad, como el tamaño de las tarjetas de memoria, suelen definirse en Gigabytes.
  • Un Terabyte (TB) está formado por 1.024 Gigabytes. Hoy en día, la capacidad de los discos duros de los ordenadores se expresa en Terabytes. El uso del almacenamiento en la nube se suele indicar en Terabytes al mes.
  • Un Petabyte (PB) equivale a 1.024 TB. Es difícil imaginar 1.125.899.906.842.624 Bytes. El tamaño de una granja de servidores podría describirse en Petabytes.
  • Un Exabyte (EB) equivale a 1.024 Petabytes. Un Exabyte es tan grande que incluso el almacenamiento total gestionado por un proveedor de nube pública sería una fracción de un Exabyte.
  • Un Zetabyte (ZB) son 1.024 Exabytes. Todos los datos del mundo son unos pocos Zetabytes.
  • Un Yottabyte (YB) equivale a 1.024 Exabytes.
  • Un Brontobyte (BB) equivale a 1.024 Yottabytes.
  • Un Geopbyte equivale a 1.024 Brontobytes. Estos números resultan útiles en astrofísica, investigación del ADN y física nuclear.

Almacenamiento de bases de datos

Antes de Hadoop, las grandes empresas utilizaban bases de datos comerciales in situ. Los almacenes de datos centralizados de Oracle, IBM y Teradata acaparaban los mayores almacenes de datos empresariales (EDB). El proyecto de código abierto Apache Hadoop puso las bases de datos en clúster de bajo coste al alcance de las empresas más pequeñas, y comenzó el movimiento Big Data. Las primeras implementaciones de Hadoop utilizaban motores de bases de datos como Hive, que ofrecían una interfaz SQL para consultar los datos almacenados en el clúster, pero eran muy lentos. Actian Vector se convirtió rápidamente en la tecnología de base de datos más rápida en los clústeres Hadoop gracias a su capacidad para almacenar datos en su formato columnar y utilizar el procesamiento vectorial para paralelizar las consultas en todos los núcleos y nodos del servidor.

En los años 90, una base de datos de Terabytes se denominaba Very Large Database (VLDB) y se utilizaba a menudo para establecer récords de referencia en el procesamiento de transacciones. En 2010, Facebook se adjudicó el mayor Cluster Hadoop clásico de Big Data Cluster Hadoop , con un tamaño de 21 Petabytes y un crecimiento de medio PB al día.

Hoy en día, el mercado de las bases de datos ha evolucionado para almacenar, consultar y extraer datos estructurados y no estructurados. La inteligencia artificial (IA) y el aprendizaje automático (ML) pueden encontrar correlaciones en grandes cantidades de datos en bruto.

Actian y las grandes bases de datos

Actian Data Platform utiliza una capacidad de consulta altamente paralela proporcionada por el motor de base de datos de procesamiento vectorial incorporado.

Actian es pionera en el sector de las bases de datos. La base de datos Ingres fue la primera en desarrollar una consulta distribuida con Ingres-Star. Hoy en día, Ingres Next ofrece una base de datos de procesamiento de transacciones sólida como una roca que utiliza almacenamiento en filas junto con una extensión integrada que utiliza stockage en colonnes optimizada para consultas de almacenamiento de datos.

Actian Data Platform funciona en las instalaciones y en la nube. La tecnología de integración de datos incorporada se conecta a cientos de fuentes de datos. Los conectores de datos externos admiten el acceso SQL a formatos Spark.