Quand les grandes données n'ont pas besoin de l'être
Mary Schulte
9 janvier 2018

L'utilisation d'un Vector FARM pour rendre l'analyse des données big data rapide et facile
Je travaille dans le secteur des technologies de l'information depuis longtemps. On fait ce que l'on veut, on fait ce que l'on veut. Mon exemple préféré est celui du partage du temps de travail des ordinateurs centraux, qui a donné naissance à l'informatique client-serveur décentralisée ; aujourd'hui, nous revenons au partage du temps de travail, mais dans le nuage. La technologie évolue. Parfois, de nouvelles idées semblent bonnes, mais elles finissent par ne plus l'être, alors nous revenons en arrière et réinventons des idées plus anciennes, mais qui ont fait leurs preuves.
Prenons l'exemple du Data Warehousing et du Big Data. Nous accumulons tous ces grandes données ; elles ne tiennent pas facilement sur un petit ordinateur, alors nous créons un ordinateur géant ou, mieux encore, une grappe de petits ordinateurs qui ressemblent à un ordinateur géant pour gérer la charge de travail.
La gestion des grappes d'ordinateurs est difficile
Sur le papier, comme dans ce diagramme, le cluster semble simple, mais en réalité, ils sont complexes à mettre en place, difficiles à équilibrer et à faire fonctionner, ils introduisent un tas de nouveaux problèmes comme le skew de sharding et la gestion de la charge de travail , et ils ne sont en fait pas si faciles à étendre... c'est dingue ! Tout l'écosystème est fragile et difficile.
À moins que vous ne fassiez partie de ces quelques entreprises qui disposent vraiment d'un grand jeu de données singulier, l'idéal d'un entrepôt de données géant et centralisé pour tout, d'un point de vue pratique, n'est tout simplement pas productif ou nécessaire. Pourquoi rendre les choses plus difficiles qu'elles ne doivent l'être ?
Ce qui est plus logique, c'est un environnement performant, facile à comprendre, facile à installer, facile à gérer et facile à modifier. Pour l'analyse, je vous propose de prendre du recul et de considérer des serveurs individuels, mais performants et faciles à gérer.
Envisagez une ferme vectorielle pour récolter facilement les objectifs de l'entreprise.
Les fermes vectorielles peuvent être très flexibles. Vous pouvez avoir une Ferme Vecteur Homogène dans laquelle vous avez une collection de serveurs individuels qui se ressemblent, chacun avec la même configuration Actian Vector sur chacun d'entre eux. La gestion est facile car : chaque serveur est indépendant, il n'y a donc pas de complexité de cluster, chacun a la même configuration de base de données, et il est facile d'ajouter/supprimer des serveurs sans affecter les autres. De plus, Actian Vector lui-même ne nécessite que peu ou pas de réglages, ce qui fait qu'il n'y a que peu de configuration individuelle. Il est même possible d'introduire de légères variations afin d'obtenir une ferme Vector hétérogène. Dans ce cas, même si la configuration de l'application peut être légèrement différente, Actian Vector offre des performances extrêmes et une grande souplesse d'utilisation. Actian Vector offre des performances extrêmes et une administration facile, sans la complexité d'un cluster. Voici quelques exemples :
Groupes indépendants d'utilisateurs similaires utilisant la même application mais ayant besoin de données distinctes
Ce scénario est le plus simple. La ferme vectorielle est particulièrement utile car elle permet de séparer facilement les données des utilisateur . Il peut s'agir par exemple d'une société multinationale qui doit légalement conserver les données européennes sur site et les séparer des données canadiennes et américaines, etc. Remarquez ici que tout est identique en ce qui concerne la configuration du serveur de base de données, y compris le nom de la base de données. La gestion de tous ces serveurs est la même. Actian Vector offre d'excellentes performances de requête à tous les utilisateurs.
Groupes indépendants d'utilisateurs de tailles différentes utilisant la même application mais ayant besoin de données distinctes
En réalité, la plupart des groupes d'utilisateurs ne sont pas identiques. Prenons l'exemple d'un fournisseur de logiciels en tant que service (SAAS). Il peut fournir un service en nuage à un grand nombre de clients, petits et grands, via l'internet. Dans ce cas, le fournisseur ne souhaite certainement pas dédier un serveur entier (virtuel ou sur site) à de très petits clients. Dans ce cas, en utilisant des schémas (une méthode permettant de créer des propriétés distinctes dans une base de données unique), le fournisseur peut regrouper l'utilisation des petits clients sur une instance de Vector, tout en desservant d'autres clients avec leurs propres instances. Dans le cas d'un client particulièrement important, il peut agrandir le serveur, tout en conservant la même structure. La gestion de tous ces serveurs se fait toujours de la même manière, en utilisant des schémas. Actian Vector offre d'excellentes performances de requête à tous les utilisateurs.
Un groupe très important d'utilisateurs exigeants
Un autre scénario est celui où la utilisateuranalyses est importante et où ces utilisateurs ont besoin de performances fiables et rapides. C'est le cas, par exemple, d'une société de services financiers qui propose une application de négociation. Les traders ont besoin d'analyses complexes et très rapides sur des données en temps réel . Un cluster complexe, avec ses nombreuses pièces mobiles, ne peut pas fournir cette analyse. Dans ce scénario, une ferme vectorielle homogène peut être utilisée comme pool pour servir tous les utilisateurs. Un bus de service en temps réel ou une file d'attente de messages peut être utilisé pour synchroniser les multiples serveurs en en temps réel. Les utilisateurs sont répartis sur n'importe lequel des serveurs disponibles dans la ferme. Là encore, la gestion est facile car tous les serveurs sont exactement les mêmes. Actian Vector (LA BASE DE DONNÉES ANALYTIQUE LA PLUS RAPIDE AU MONDE) offre des temps de réponse exceptionnels.
Utilisateurs indépendants et applications
Le dernier scénario est celui d'une ferme vectorielle véritablement hétérogène. Dans ce scénario, les utilisateurs ne sont pas nécessairement segmentés, il existe différentes applications analytiques avec différentes structures de base de données. Les applications étant différentes, il n'y a pas de besoin opérationnel de conserver les données dans un emplacement central sur une grappe complexe. Parce qu'Actian Vector est si performant, facile à mettre en place et à gérer, une ferme Vector est un moyen efficace de faciliter le support ces utilisateurs et de ces applications.
Conclusion
Pourquoi vous torturer avec une grappe complexe si vous n'avez pas à le faire ? En raison de la performance, de la facilité d'administration et du peu ou de l'absence de réglages personnalisés, il est facile de tirer parti des serveurs individuels d'une ferme Actian Vector. Parce que vous n'avez pas à effectuer l'analyse complexe de la construction et de la maintenance d'une grappe et parce que Vector nécessite peu de réglages, vous pouvez mettre en service les composants de votre ferme Vector rapidement et commencer à " récolter " de la valeur commerciale immédiatement !
Plus d'informations sur Actian Vector
Vous souhaitez en savoir plus sur Actian Vector ?
Vous pouvez également télécharger et essayer Actian Vector vous-même (ou vous pouvez essayer Vector Community Edition sur AWS sans avoir à obtenir une licence d'évaluation). Vous ne serez pas déçu, et si vous avez besoin d'aide, demandez à la communauté.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.