Intégration Embarqué : Le calcul analytique là où se trouvent les données
Actian Corporation
28 janvier 2020

Le choix du meilleur emplacement pour votre calcul analytique pose un dilemme intéressant qui donne lieu à un débat réfléchi dans certaines entreprises, tandis que d'autres n'envisagent même pas le sujet. Si vous travaillez avec des systèmes distribués, des capteurs Embarqué dans des machines, des applications mobiles ou des appareils IoT, ce sujet est pour vous ! L'emplacement des ressources de calcul pour l'analyse a un impact significatif sur la performance de vos solutions, la charge sur votre réseau et les coûts du stockage centralisé des données ( sur site ou dans le cloud).
Qu'est-ce que l'Analytics Compute ?
En termes simples, l'informatique analytique est la capacité de traitement des données que vous utilisez pour convertir des données brutes en informations significatives. Les systèmes Embarqué génèrent des données soit par le biais de capteurs, soit par le biais de journaux de leurs activités. Ces données sont pertinentes mais ne sont pas très utiles tant qu'elles n'ont pas été traitées et affinées en informations, puis en perspectives exploitables. Ce processus d'affinage implique la collecte, le filtrage, le tri, la classification, l'évaluation, l'interprétation et la synthèse de flux de données à l'aide de règles de gestion, d'algorithmes mathématiques, de méthodes statistiques et de modèles de correspondance de modèles. Lorsque vous appliquez ces techniques analytiques et ces règles de gestion à vos données streaming , c'est le calcul analytique.
Le dilemme lié à l'emplacement des capacités de calcul
Les systèmes Embarqué sont aussi typiquement des systèmes distribués - existant dans de nombreux endroits différents à l'intérieur et à l'extérieur de votre entreprise. Les personnes qui ont besoin de comprendre les données générées par les systèmes Embarqué sont souvent centralisées - situées dans un immeuble de bureaux éloigné du système générant les données. Ceci est important car non seulement les données des systèmes Embarqué doivent être raffinées en informations significatives, mais elles doivent aussi être transportées de leur source d'origine à la personne qui a besoin de les voir. C'est là qu'intervient le dilemme : où faut-il faire l'analyse ?
- À la source, au sein même du système Embarqué ?
- À la périphérie du réseau, dans un dispositif périphérique ?
- Dans le nuage ou dans un centre de données centralisé ?
- Dans un entrepôt de données sur site, en nuage ou dans un environnement hybride ?
- Dans le système de reporting, où l'information doit-elle être consommée ?
Chacune de ces options présente des avantages et des inconvénients. Les centres de données centralisés et les entrepôts de données en nuage sont des systèmes à grande échelle qui permettent de réaliser des économies d'échelle, rendant les ressources de calcul moins chères. Le problème est d'acheminer les données jusqu'à eux. Si vous transmettez toutes vos données brutes à un service en nuage, à un entrepôt de données ou à l'ordinateur de votre utilisateur final, vous transmettez de grandes quantités de données dont vous n'avez pas vraiment besoin (données qui seront filtrées lors de l'analyse). Vous chargez également votre réseau, vous augmentez la latence, vous augmentez vos coûts de réseau et vous ralentissez potentiellement d'autres activités commerciales qui ont besoin d'utiliser cette capacité. Si vous effectuez des opérations de calcul au sein du système Embarqué ou dans un dispositif périphérique, vous évitez le trafic réseau. Cependant, vous ne bénéficiez pas des économies d'échelle et les ressources de calcul sont plus chères.
Une règle générale pour une efficacité optimale : "Placez votre calcul analytique là où se trouvent les données.
Relativement parlant, les ressources de calcul (même distribuées) sont moins chères que la capacité du réseau. La plupart des systèmes sous-utilisent leur capacité de calcul, ce qui signifie que les ressources que vous payez déjà sont gaspillées. La règle générale recommandée par les experts en données est la suivante : "Placez votre calcul analytique là où se trouvent les données" ou le plus près possible. Si les données brutes sont générées dans les systèmes Embarqué , effectuez autant d'analyses que possible sur ces données, soit dans le système Embarqué , soit dans un périphérique de réseau. Au minimum, effectuez les tâches qui filtrent les données inutiles et réduisent le volume de données à transmettre sur le réseau.
Une fois que vous avez épuré les données streaming en effectuant le premier niveau de traitement analytique sur le terrain, vous aurez probablement besoin de combiner les données provenant de différents systèmes Embarqué ou de dispositifs distribués. L'agrégation des données et les analyses ultérieures ne peuvent pas être effectuées efficacement sur le terrain et conviennent mieux à un entrepôt de données. Allez-y donc et transférez vos données (prétraitées) vers un entrepôt de données entrepôt de données cloud ou sur site , où vous pourrez travailler avec les données par lots. Le calcul analytique des données stockées dans un entrepôt doit également être effectué le plus près possible de l'endroit où se trouvent les données. Si vous pouvez effectuer le calcul sur le même hôte physique, c'est génial ! Si ce n'est pas le cas, faites-le dans le même centre de données afin d'éviter toute latence du réseau dans votre traitement.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.