Blog | Perspectivas | | 2 min de lectura

Las 5 principales trampas de los almacenes de datos tradicionales

concepto de tecnología de nube híbrida con almacenes de datos

En las últimas dos décadas, las soluciones de almacenamiento de datos han evolucionado y se han diversificado para dar respuesta a una gran variedad de casos de uso. Mientras tanto, el ritmo de los negocios sigue acelerándose, lo que dificulta mantener la competitividad. Estas nuevas exigencias pueden poner a prueba las capacidades de los almacenes de datos tradicionales.

A continuación se enumeran cinco de los errores más comunes que pueden afectar a los almacenes de datos tradicionales:

Moneda

A medida que aumentan las exigencias para que las organizaciones operen en tiempo real o al instante, los almacenes de datos deben proporcionar datos cada vez más actualizados. Las bases de datos SQL Hadoop suelen ser incapaces de gestionar flujos continuos de actualizaciones, ya que el sistema de archivos está optimizado para actualizaciones por lotes poco frecuentes, con una ventana móvil de datos históricos. La falta de datos actualizados puede implicar que las empresas no respondan a las amenazas y oportunidades con la rapidez suficiente para mantener su competitividad.

Seguridad

Las normativas de privacidad cada vez más estrictas, como el RGPD, y la creciente frecuencia de las filtraciones de datos han convertido la seguridad en un tema de primera plana que afecta a la reputación. Las bases de datos de gama baja pueden carecer de funciones avanzadas de cifrado para los datos en tránsito y en reposo. El enmascaramiento de datos a nivel de columna es una función avanzada de la que carecen muchas bases de datos, lo que supone un grave inconveniente.

Velocidad

Hay muchas razones por las que una consulta analítica puede ser lenta. Podría deberse a que el administrador de bases de datos no la previó y no definió un índice específico, lo que hace que la base de datos no sea adecuada para consultas ad hoc. Este problema se ve agravado por la tendencia actual hacia los «analistas de datos ciudadanos», en la que usuarios con un conocimiento limitado de las estructuras de datos subyacentes pueden colapsar una base de datos.

Precio

A medida que aumentan los volúmenes y los tipos de datos, ampliar la capacidad puede resultar costoso. Esto es especialmente cierto en el caso de las soluciones basadas en dispositivos, como IBM Netezza, en las que ampliar la capacidad puede suponer la adquisición de un dispositivo de mayor tamaño. Las soluciones más abiertas basadas en Hadoop y en la nube, que utilizan servidores y sistemas operativos estándar, han ganado popularidad para hacer frente al coste de la infraestructura, pero plantean otros problemas de costes ocultos, como la necesidad de contar con personal cualificado, lo cual puede resultar costoso, y el riesgo de dependencia de un único proveedor.

Implementación

Algunas bases de datos requieren unos conocimientos muy avanzados de desarrollo y administración. Oracle y Teradata se encuentran entre ellas. Los servicios de bases de datos en la nube resuelven esta complejidad en cierta medida, así que hay esperanza.

Cada organización tiene prioridades diferentes, por lo que es posible que clasifiquen estos cinco escollos de forma distinta. No te pierdas mi próxima entrada del blog de la serie «¿Qué es un almacén de datos operativos y por qué es la próxima gran novedad?», donde describiré la próxima gran novedad en el análisis de datos, sus ventajas y mucho más.