Cuando los GRANDES DATOS no tienen por qué serlo
Mary Schulte
9 de enero de 2018

Utilización de un FARM vectorial para facilitar y agilizar el analyse des données big data
Llevo mucho tiempo trabajando en el sector informático. Lo que va, vuelve. Mi ejemplo favorito es cómo la multipropiedad centralizada del mainframe dio lugar a la informática descentralizada cliente-servidor, y ahora estamos volviendo a la multipropiedad, pero en la nube. La tecnología evoluciona. A veces las nuevas ideas parecen buenas, pero acaban no siéndolo tanto, así que volvemos atrás y reinventamos ideas más antiguas, pero probadas.
Tomemos como ejemplo el almacenamiento de datos y los macrodatos. Todos estamos acumulando grandes cantidades de datos que no caben fácilmente en un ordenador pequeño, así que creamos un ordenador gigante o, mejor aún, un clúster de ordenadores pequeños que parece un ordenador gigante para gestionar la carga de trabajo.
Gestionar clusters de ordenadores ES DIFÍCIL
Sobre el papel, como en este diagrama, el clúster parece sencillo, pero en realidad, son complejos de configurar, difíciles de mantener equilibrados y en funcionamiento, introducen un montón de nuevos problemas como la fragmentación y la gestión de la carga de trabajo, y en realidad no son tan fáciles de ampliar... ¡es una locura! Todo el ecosistema es frágil y difícil.
A menos que seas una de esas pocas corporaciones que realmente tienen un gran jeu de données singular jeu de données, el ideal del gigantesco Almacén de Datos centralizado de todo, desde una perspectiva práctica, simplemente no es tan productivo o necesario. ¿Por qué complicar las cosas más de lo necesario?
Lo que tiene más sentido es un entorno eficaz, fácil de entender, fácil de configurar, fácil de gestionar y fácil de cambiar. Para los análisis, te propongo que des un paso atrás y consideres servidores individuales, pero de alto rendimiento y fáciles de gestionar.
Considere una granja de vectores para cosechar fácilmente los objetivos empresariales.
Las granjas de vectores pueden ser muy flexibles. Usted podría tener una Granja Vectorial Homogénea en la que tiene una colección de servidores individuales que se parecen, cada uno con la misma configuración de Actian Vector en cada uno. La gestión es fácil porque: cada servidor es independiente por lo que no hay complejidad de clúster, cada uno tiene la misma configuración de base de datos, y es fácil añadir / eliminar servidores sin afectar a los demás. Además, el propio Actian Vector requiere poco o ningún ajuste, por lo que hay poca configuración individualizada. Incluso puede introducir ligeras variaciones de tal forma que tenga una Granja Vectorial Heterogénea. En cuyo caso, aunque la configuración de la aplicación puede ser un poco diferente. Actian Vector proporciona un rendimiento extremo y fácil-admin, sin la complejidad de un cluster. He aquí algunos ejemplos:
Grupos independientes de usuarios similares que utilizan la misma aplicación pero necesitan datos distintos
Este escenario es el más sencillo. La granja de vectores es especialmente útil porque permite separar fácilmente los datos de los usuarios. Un ejemplo de esto podría ser una corporación multinacional que legalmente necesita mantener los datos europeos en sur site y separados de los datos canadienses y estadounidenses, etc. Observe aquí que todo es igual en la configuración del servidor de base de datos, incluido el nombre de la base de datos. La gestión de todos estos servidores es la misma. Actian Vector proporciona un enorme rendimiento de consulta a todos los usuarios.
Grupos independientes de usuarios de distinto tamaño que utilizan la misma aplicación pero necesitan datos distintos
En realidad, la mayoría de los grupos de usuarios no son iguales. Tomemos como ejemplo un proveedor de software como servicio (SAAS). Un proveedor de SAAS puede ofrecer un servicio en la nube a una gran variedad de clientes, grandes y pequeños, a través de Internet. En este caso, el proveedor ciertamente no querría dedicar un servidor entero (virtual o sur site) a clientes muy pequeños. En este caso, utilizando esquemas (un método de creación de propiedad separada en una base de datos singular), el proveedor puede agrupar el uso de clientes pequeños en una instancia del Vector, mientras atiende a otros con sus propias instancias. En los casos en que se trate de un cliente particularmente grande, podrían hacer ese servidor más grande, pero manteniendo la misma estructura. La gestión de todos estos servidores sigue siendo la misma utilizando esquemas. Actian Vector proporciona un enorme rendimiento de consulta a todos los usuarios.
Un grupo MUY grande de usuarios exigentes
Otro escenario es cuando la base de usuarios de análisis es grande y estos usuarios necesitan un rendimiento fiable y rápido. Un ejemplo es una empresa de servicios financieros que ofrece una aplicación de negociación. Los operadores necesitan análisis muy rápidos y complejos de datos en tiempo real. Un clúster complejo, con su sobrecarga de muchas piezas móviles, físicamente no puede proporcionar esto. En este escenario, se puede utilizar una Granja de Vectores Homogéneos como pool para dar servicio a todos los usuarios. Se puede utilizar un bus de servicio en tiempo real o una cola de mensajes para sincronizar los múltiples servidores en tiempo real. Los usuarios se equilibran con cualquiera de los servidores disponibles en la Granja. De nuevo, la gestión es fácil porque todos los servidores son exactamente iguales. Actian Vector (LA BASE DE DATOS ANALÍTICA MÁS RÁPIDA DEL MUNDO) proporciona tiempos de respuesta enormes.
Usuarios y aplicaciones independientes
El último escenario es una granja de vectores verdaderamente heterogénea. En este escenario, los usuarios no están necesariamente segmentados, hay diferentes aplicaciones de análisis con diferentes estructuras de bases de datos. Las aplicaciones son diferentes, por lo que no hay necesidad operativa de mantener los datos en una ubicación central en un clúster complejo. Debido a que Actian Vector es tan eficiente, fácil de configurar y gestionar, una Granja Vectorial es una forma efectiva de facilitar el soporte a estos usuarios y aplicaciones.
Conclusión
¿Por qué torturarse con un clúster complejo si no es necesario? Debido al rendimiento, la facilidad de administración y el poco o ningún ajuste personalizado, es fácil aprovechar los servidores individuales en una Actian Vector Farm. Debido a que no tiene que pasar por el complejo análisis de construir y mantener un clúster y debido a que Vector requiere poco ajuste, ¡puede poner en marcha los componentes de su Granja Vector rápidamente y empezar a "cosechar" valor de negocio de inmediato!
Más información sobre Actian Vector
¿Quiere saber más sobre Actian Vector?
También puede descargar y probar Actian Vector usted mismo (o puede probar Vector Community Edition en AWS sin tener que obtener una licencia de evaluación). No te decepcionará, y si necesitas ayuda para entender las cosas, solo tienes que preguntar a la Comunidad.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.