Analyser et agir sur les données transactionnelles avec un entrepôt de données opérationnel
Résumé
- Les entrepôts de données opérationnels permettent d'obtenir des informations exploitables en temps réel à partir de données récentes.
- Dépassez les limites des entrepôts de données d'entreprise (EDW), des lacs de données et des solutions d'analyse exclusivement basées sur le cloud.
- Principales caractéristiques : rapide, évolutif, flexible, sécurisé et en temps quasi réel.
- Actian Analytics Engine offre des performances élevées grâce au traitement vectorisé.
- Prend en charge l'analyse ad hoc, les volumes de données importants et une sécurité de niveau entreprise.
Nous entendons tous dire que les entreprises avant-gardistes, petites ou grandes, doivent être davantage axées sur le client, voire obsédées par lui, pour réussir dans ce monde hyperconcurrentiel. Les données permettent de mieux cerner les besoins et les comportements de vos clients, ce qui vous permet d’adapter activement vos messages et vos offres afin de vous démarquer de la concurrence et de les convaincre. Ces connaissances proviennent d’une variété croissante de sources disponibles 24 heures sur 24 et 7 jours sur 7, via des systèmes numériques et, de plus en plus, une multitude de capteurs, d’appareils et d’applications mobiles qui suivent ces activités. Mais le volume de données peut être écrasant, et la valeur de vos données peut se déprécier rapidement avec le temps ; il est donc impératif de disposer d’une infrastructure permettant d’exploiter rapidement ces informations périssables afin d’influencer le moment et la manière dont vous interagissez avec vos clients cibles. Cela nécessite une nouvelle approche de la gestion des données en temps réel, que nous appelons « entrepôt de données opérationnel » (ODW). Un ODW peut aller au-delà du simple reporting sur des données historiques et statiques et peut, à la place, exploiter des données fraîches et actives pour piloter des actions commerciales spécifiques – au moment où l'activité se déroule.
Les entreprises disposent déjà d'un certain nombre de solutions pour obtenir des informations analytiques, qu'il s'agisse de systèmes de bases de données relationnelles, d'entrepôts de données d'entreprise ou de lacs de données, au sein de leurs centres de données ou, de plus en plus, dans l'informatique dématérialisée. Les solutions existantes impliquent généralement des compromis importants qu'un entrepôt de données opérationnel peut surmonter.
Prenons l'exemple de l'entrepôt de données d'entreprise traditionnel, qui existe depuis des décennies. Il s'agit d'une méthode bien établie pour gérer les données historiques, effectuer des mises à jour par lots, prendre en charge des cycles de reporting réguliers et servir de source unique de vérité pour l'entreprise. Cependant, il s'agit généralement d'une solution coûteuse, surtout si l'on doit mettre à niveau le matériel, augmenter la capacité, ajouter de nouveaux types de données et moderniser les modes d'accès. Un entrepôt de données d'entreprise (EDW) soigneusement géré par le service informatique pour gouvernance contrôler les coûts exige que les nouveaux rapports passent par un processus de changement formel qui peut ralentir le développement. Si un EDW gère bien les charges de travail planifiées, il est peu performant pour les requêtes ad hoc, ce qui rend difficile découverte de données la génération d'analyses exploitables sans impact sur les charges de travail de reporting existantes.
Une autre option pour certains est un magasin de données opérationnel qui offre une plus grande flexibilité des données et un environnement séparé pour permettre une analyse ad hoc, mais qui se concentre généralement de manière rigide sur un domaine ou un type de données et n'est pas complet. Comme un EDW, il peut ne pas être optimisé pour les performances des requête analytiques interactives nécessaires à la découverte.
Les lacs de données sont considérés par beaucoup comme une solution plus économique et évolutif , avec un stockage pour de nombreuses sources et types de données. Cependant, ils peuvent devenir un dépotoir de données dont la gouvernance et la validation laissent à désirer. Son héritage architectural, conçu pour une ingestion de données facile et flexible ingestion de données , se traduit à son tour par des performances de requête lentes, unesimultanéité utilisateur médiocre et des résultats imprévisibles.
Le dernier objet brillant à apparaître est la base de données analytique en nuage, qui promet un stockage et des performances économiques ainsi qu'un déploiement élastique illimité. En réalité, ces solutions "cloud-only" peuvent entraîner des coûts de calcul élevés ou imprévisibles, des options de déploiement limitées avec un fort potentiel de verrouillage des fournisseurs/architectures/données, ainsi qu'une gestion et des outils relativement nouveaux et immatures. Existe-t-il une meilleure solution ?
La solution idéale pour l'analyse opérationnelle présenterait toutes les meilleures caractéristiques des alternatives mentionnées ci-dessus, sans aucune de leurs lacunes. Cette nouvelle approche devrait être :
- Rapide - L'architecture sous-jacente serait optimisée pour les performances des requête analytiques et ne nécessiterait que peu ou pas de réglages en prévision de certaines charges de travail (comme l'indexation ou les agrégations), ce qui maximiserait la variété des charges de travail qu'elle pourrait support.
- évolutif - Il s'adapterait à de grandes capacités de données grâce à une couche de stockage économique et flexible, en se connectant à une variété de sources de données existantes et nouvelles.
- Flexible - Il offrirait des options de déploiement flexibles, sur site ou sur différentes plateformes en nuage.
- Actuel - Il doit être capable d'effectuer des mises à jour en temps quasi réel à partir des systèmes opérationnels afin de rester en phase avec l'activité, sans ralentir les performances des requêtes analytiques en cours.
- Robuste - Il offre une sécurité, une fiabilité et une facilité de gestion au niveau de l'entreprise.
- Sécurisé - Il offrirait un certain nombre de mécanismes de protection des données pour répondre aux exigences de sécurité des entreprises et se conformer à des environnements réglementaires plus stricts.
Ces caractéristiques définissent ce que nous appelons un entrepôt de données opérationnel. Avec une telle solution, vous disposeriez d'un système de base de données capable de fournir des informationsinformations en temps réel dans l'entreprise pour une variété d'utilisateurs, des data scientists aux analystes commerciaux. Il support découverte de données et l'analyse ad hoc en libre-service en utilisant les données opérationnelles les plus récentes, sans alourdir les systèmes transactionnels et les charges de travail.
Actian Analytics Engine a été entièrement repensé pour devenir un entrepôt de données opérationnel, capable d'exploiter les données en temps réel. Non seulement il est rapide, évolutif et flexible, mais il est également prêt à être déployé en production grâce à des fonctionnalités éprouvées en matière de sécurité, d'administration et de gestion des ressources.
Ce moteur est la base de données analytique la plus rapide disponible sur des serveurs standard, sur site dans le cloud. L'objectif initial était d'exécuter le code SQL aussi rapidement que s'il avait été écrit en code C optimisé, en tirant parti des instructions vectorisées des processeurs standard ainsi que d'un format de données en colonnes pour traiter les requêtes analytiques plus efficacement. Il a atteint cet objectif et bien plus encore, en enregistrant de nombreux résultats de tests de enregistrement impressionnants enregistrement au cours des six dernières années. De plus, Actian Analytics Engine ne nécessite pas de réglages de performances ni d'optimisations spécifiques, tels que l'indexation et le réglage, offrant ainsi d'excellentes performances dès son installation. Cela rend Actian Analytics Engine idéal pourdécouverte de données ad hoc libre-service , avec des performances interactives et des temps de cycle réduits pour une itération plus rapide, et ce sur des ensembles de données complets, et non sur des échantillons.
Actian Analytics Engine offre évolutivité un seul serveur à des clusters comptant des centaines de nœuds, en utilisant le système de fichiers distribué de Hadoop et YARN pour gérer les ressources et répartir la charge de travail où les données sont stockées. Actian Analytics Engine traite des gigaoctets, des téraoctets et des pétaoctets de données, et s'adapte à un nombre d'utilisateurs simultanés bien supérieur à celui des autres solutions MPP.
Actian Analytics Engine a hérité de l'infrastructure administrative SGBDR transactionnels bien établis d'Actian, tirant parti de la maturité éprouvée en matière de requête et requête , ingestion de données, de qualité des données, de sécurité, de fiabilité et de facilité de gestion. Actian DataFlow complète parfaitement Actian Analytics Engine en offrant un contrôle plus rapide et plus intuitif sur ingestion de données les workflows analytiques, notamment grâce à une utilisateur graphique optimisée par KNIME, qui facilite la création et l'optimisation requête .
L'analyse de données permet d'obtenir les informations les plus pertinentes à partir de données à jour, mais la plupart des solutions analytiques reposent sur des mises à jour par lots et des modèles d'accès de type « écriture unique, lectures multiples », qui ne permettent pas support des modifications support . Actian Analytics Engine utilise une technique brevetée appelée « arbres delta positionnels » pour gérer les mises à jour des données existantes sans affecter requête . Il en résulte une solution analytique capable d'intégrer des mises à jour régulières et fréquentes afin de fournir les informations les plus récentes sur votre activité.
Avec l'entrée en vigueur du RGPD, on constate une attention accrue portée à la confidentialité et à la sécurité. Les nouvelles versions d'Actian Analytics Engine intègrent toutes les Fonctionnalités pour support déploiement conforme au RGPD, et les ajouts récents facilitent l'administration et le développement de solutions sécurisées. Par exemple, le masquage des données garantit que seuls les utilisateurs autorisés peuvent consulter les données sous-jacentes, tandis que les autres ne voient qu'une valeur masquée.
Actian Analytics Engine offre un large éventail déploiement : il fonctionne sur des serveurs standard sous Linux ou Windows et prend également en charge différentes distributions Hadoop pour permettre une évolutivité horizontale sur des clusters ou une infrastructure cloud. Vector prend également en charge un large éventail d'options de stockage, ce qui évite toute dépendance technologique pour votre entrepôt de données opérationnel.
Découvrez dès aujourd'hui Actian Analytics Engine sur AWS Marketplace!