Inteligencia de datos

Cuando los GRANDES DATOS no tienen por qué serlo

Mary Schulte

9 de enero de 2018

niño con traje pensando en big data

Utilización de un FARM vectorial para facilitar y agilizar el analyse des données big data

Llevo mucho tiempo trabajando en el sector informático. Lo que va, vuelve. Mi ejemplo favorito es cómo la multipropiedad centralizada del mainframe dio lugar a la informática descentralizada cliente-servidor, y ahora estamos volviendo a la multipropiedad, pero en la nube. La tecnología evoluciona. A veces las nuevas ideas parecen buenas, pero acaban no siéndolo tanto, así que volvemos atrás y reinventamos ideas más antiguas, pero probadas.

Tomemos como ejemplo el almacenamiento de datos y los macrodatos. Todos estamos acumulando grandes cantidades de datos que no caben fácilmente en un ordenador pequeño, así que creamos un ordenador gigante o, mejor aún, un clúster de ordenadores pequeños que parece un ordenador gigante para gestionar la carga de trabajo.

Gestionar clusters de ordenadores ES DIFÍCIL

solución de clúster big data

Sobre el papel, como en este diagrama, el clúster parece sencillo, pero en realidad, son complejos de configurar, difíciles de mantener equilibrados y en funcionamiento, introducen un montón de nuevos problemas como la fragmentación y la gestión de la carga de trabajo, y en realidad no son tan fáciles de ampliar... ¡es una locura! Todo el ecosistema es frágil y difícil.

A menos que seas una de esas pocas corporaciones que realmente tienen un gran jeu de données singular jeu de données, el ideal del gigantesco Almacén de Datos centralizado de todo, desde una perspectiva práctica, simplemente no es tan productivo o necesario. ¿Por qué complicar las cosas más de lo necesario?

Lo que tiene más sentido es un entorno eficaz, fácil de entender, fácil de configurar, fácil de gestionar y fácil de cambiar. Para los análisis, te propongo que des un paso atrás y consideres servidores individuales, pero de alto rendimiento y fáciles de gestionar.

Considere una granja de vectores para cosechar fácilmente los objetivos empresariales.

Las granjas de vectores pueden ser muy flexibles. Usted podría tener una Granja Vectorial Homogénea en la que tiene una colección de servidores individuales que se parecen, cada uno con la misma configuración de Actian Vector en cada uno. La gestión es fácil porque: cada servidor es independiente por lo que no hay complejidad de clúster, cada uno tiene la misma configuración de base de datos, y es fácil añadir / eliminar servidores sin afectar a los demás. Además, el propio Actian Vector requiere poco o ningún ajuste, por lo que hay poca configuración individualizada. Incluso puede introducir ligeras variaciones de tal forma que tenga una Granja Vectorial Heterogénea. En cuyo caso, aunque la configuración de la aplicación puede ser un poco diferente. Actian Vector proporciona un rendimiento extremo y fácil-admin, sin la complejidad de un cluster. He aquí algunos ejemplos:

Grupos independientes de usuarios similares que utilizan la misma aplicación pero necesitan datos distintos

Este escenario es el más sencillo. La granja de vectores es especialmente útil porque permite separar fácilmente los datos de los usuarios. Un ejemplo de esto podría ser una corporación multinacional que legalmente necesita mantener los datos europeos en sur site y separados de los datos canadienses y estadounidenses, etc. Observe aquí que todo es igual en la configuración del servidor de base de datos, incluido el nombre de la base de datos. La gestión de todos estos servidores es la misma. Actian Vector proporciona un enorme rendimiento de consulta a todos los usuarios.

granja de vectores homogéneos

Grupos independientes de usuarios de distinto tamaño que utilizan la misma aplicación pero necesitan datos distintos

En realidad, la mayoría de los grupos de usuarios no son iguales. Tomemos como ejemplo un proveedor de software como servicio (SAAS). Un proveedor de SAAS puede ofrecer un servicio en la nube a una gran variedad de clientes, grandes y pequeños, a través de Internet. En este caso, el proveedor ciertamente no querría dedicar un servidor entero (virtual o sur site) a clientes muy pequeños. En este caso, utilizando esquemas (un método de creación de propiedad separada en una base de datos singular), el proveedor puede agrupar el uso de clientes pequeños en una instancia del Vector, mientras atiende a otros con sus propias instancias. En los casos en que se trate de un cliente particularmente grande, podrían hacer ese servidor más grande, pero manteniendo la misma estructura. La gestión de todos estos servidores sigue siendo la misma utilizando esquemas. Actian Vector proporciona un enorme rendimiento de consulta a todos los usuarios.

esquemas con granja de vectores

Un grupo MUY grande de usuarios exigentes

Otro escenario es cuando la base de usuarios de análisis es grande y estos usuarios necesitan un rendimiento fiable y rápido. Un ejemplo es una empresa de servicios financieros que ofrece una aplicación de negociación. Los operadores necesitan análisis muy rápidos y complejos de datos en tiempo real. Un clúster complejo, con su sobrecarga de muchas piezas móviles, físicamente no puede proporcionar esto. En este escenario, se puede utilizar una Granja de Vectores Homogéneos como pool para dar servicio a todos los usuarios. Se puede utilizar un bus de servicio en tiempo real o una cola de mensajes para sincronizar los múltiples servidores en tiempo real. Los usuarios se equilibran con cualquiera de los servidores disponibles en la Granja. De nuevo, la gestión es fácil porque todos los servidores son exactamente iguales. Actian Vector (LA BASE DE DATOS ANALÍTICA MÁS RÁPIDA DEL MUNDO) proporciona tiempos de respuesta enormes.

vector granja grande

Usuarios y aplicaciones independientes

El último escenario es una granja de vectores verdaderamente heterogénea. En este escenario, los usuarios no están necesariamente segmentados, hay diferentes aplicaciones de análisis con diferentes estructuras de bases de datos. Las aplicaciones son diferentes, por lo que no hay necesidad operativa de mantener los datos en una ubicación central en un clúster complejo. Debido a que Actian Vector es tan eficiente, fácil de configurar y gestionar, una Granja Vectorial es una forma efectiva de facilitar el soporte a estos usuarios y aplicaciones.

usuarios independientes granja de vectores

Conclusión

¿Por qué torturarse con un clúster complejo si no es necesario? Debido al rendimiento, la facilidad de administración y el poco o ningún ajuste personalizado, es fácil aprovechar los servidores individuales en una Actian Vector Farm. Debido a que no tiene que pasar por el complejo análisis de construir y mantener un clúster y debido a que Vector requiere poco ajuste, ¡puede poner en marcha los componentes de su Granja Vector rápidamente y empezar a "cosechar" valor de negocio de inmediato!

Más información sobre Actian Vector

¿Quiere saber más sobre Actian Vector?

También puede descargar y probar Actian Vector usted mismo (o puede probar Vector Community Edition en AWS sin tener que obtener una licencia de evaluación). No te decepcionará, y si necesitas ayuda para entender las cosas, solo tienes que preguntar a la Comunidad.

mary schulte headshot

Sobre Mary Schulte

Mary Schulte es ingeniera de ventas sénior de Actian. Ha pasado la mayor parte de su carrera trabajando para potentes proveedores de bases de datos como Informix, Netezza y, ahora, Actian. Durante más de dos décadas, trabajó exclusivamente con Informix como consultora en una empresa de consultoría boutique, y más tarde como formadora e ingeniera de ventas para Informix Corp. y después para IBM. Ha escrito miles de líneas de programas Informix 4GL y ESQL/C para clientes de diversos sectores de todo el mundo. Con base en Dallas, trabajó estrechamente con American Airlines en su innovadora implementación de la entonces nueva tecnología Informix datablade a finales de los 90. Mary lleva en Actian desde 2006, trabajando principalmente con su tecnología Vector base de données analytique . Cree que fue casualidad que IBM llegara a un acuerdo con HCL y que HCL adquiriera Actian, porque ahora vuelve a trabajar con su querido Informix.