Virtualización de datos: ¿Déja Vu del almacén virtual de datos?
Teresa Wingfield
3 de enero de 2022

En los años noventa, yo era analista del sector de almacenamiento de datos e informatique décisionnelle en Giga Information Group (posteriormente adquirida por Forrester Research). Me sigue sorprendiendo lo poco que han cambiado estas tecnologías desde entonces. Hoy en día, las organizaciones siguen enfrentándose a algunas de las mismas complejidades a la hora de crear un almacén de datos y siguen encontrando muy atractivo el atractivo de un atajo como la virtualización de datos.
¿Qué es la virtualización de datos?
El objetivo de la virtualización de datos no es nuevo. Al igual que el concepto de almacén de datos virtual que surgió hace unos treinta años, la virtualización de datos permite ejecutar consultas directamente en el sistema o sistemas de origen en lugar de trasladar los datos a un almacén de datos físico.
El software facilita más que en el pasado el desarrollo, la puesta en marcha y la gestión de la virtualización de datos al ofrecer al menos algunas de las siguientes capacidades:
Abstracción
Resuma los aspectos técnicos de los datos almacenados, como la ubicación, la estructura de almacenamiento, la API, el lenguaje de acceso y la tecnología de almacenamiento.
Acceso a datos virtualizados
Conéctese a distintas fuentes de datos y hágalas accesibles desde un punto lógico común de acceso a los datos.
Transformación
Transformar, mejorar la calidad, reformatear, agregar, etc. los datos de origen para uso de los consumidores.
Federación de datos
Combinar conjuntos de resultados de varios sistemas de origen.
Entrega de datos
Publicar conjuntos de resultados como vistas y/o servicios de datos ejecutados por aplicaciones cliente o usuarios cuando se soliciten.
Por qué sigue necesitando un almacén de datos
Aunque las soluciones de software han hecho que la virtualización de datos sea más sencilla de lo que solía ser, la virtualización de datos se enfrenta a algunos de los mismos problemas que los almacenes de datos virtuales de antaño, especialmente si se intenta utilizar este enfoque para sustituir a un almacén de datos en lugar de como complemento de un almacén de datos para determinados casos de uso.
Estas son algunas de las principales razones por las que realmente necesita un almacén de datos:
- En un almacén de datos, los informes y análisis pueden realizarse sin afectar negativamente al rendimiento de sus sistemas operativos. Por ejemplo, imagine cómo podría afectar a las ventas la ralentización de sus aplicaciones de comercio electrónico.
- Un almacén de datos ofrece un mejor rendimiento para las consultas analíticas que las bases de datos transaccionales, que están diseñadas para leer y escribir filas individuales de forma eficiente. Además, es casi imposible conseguir un rendimiento aceptable cuando las consultas implican uniones y agregaciones complejas y de alta cardinalidad entre sistemas fuente.
- Un almacén de datos permite archivar a largo plazo los datos transaccionales. Esto ofrece dos ventajas: En primer lugar, los sistemas fuente pueden purgarse de datos antiguos para garantizar un alto rendimiento continuado; en segundo lugar, los datos históricos sirven de base para muchos requisitos analíticos, especialmente en escenarios de inteligencia artificial y aprendizaje automático en los que a menudo se requieren datos históricos para obtener resultados válidos.
- A diferencia de la virtualización de datos, un almacén de datos puede seguir proporcionando información cuando los sistemas fuente están fuera de línea o no están disponibles. La virtualización de datos intenta superar el problema de la indisponibilidad del sistema de origen mediante mecanismos de caché de datos, pero no es factible almacenar en caché todo lo que puede ser necesario.
- Las herramientas de extracción, transformación y carga (ETL) y de calidad de datos utilizadas en el almacenamiento de datos ayudan a gestionar requisitos de transformación complejos y a resolver problemas de calidad de datos que la virtualización de datos no resuelve.
El papel de la virtualización de datos
Aunque no sustituye a un almacén de datos, la virtualización de datos es un complemento valioso para ayudar a hacer frente a muchos obstáculos, incluidas las situaciones en las que:
- No puede trasladar sus datos a un almacén de datos debido a restricciones de cumplimiento.
- Tiene demasiados datos en el borde para moverlos al almacén de datos.
- Es necesario dar cabida a consultas imprevistas que requieran acceso a datos no almacenados en el almacén de datos.
- Se necesitan varias pasadas por los datos in-memory para satisfacer las necesidades de procesamiento iterativo.
Resumen
La virtualización de datos puede ser útil como complemento de un verdadero almacén de datos, pero no puede sustituirlo. Para obtener más información sobre las ventajas del almacén de datos, le sugiero que lea Almacén de datos frente a base de datos: ¿cuál debe elegir? Aunque los atajos no sirven cuando se trata de almacenar datos, estas prácticas recomendadas le ayudarán.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.