GénAI Best Practices for Data Scientists, Engineers, and IT Leaders (Pratiques exemplaires de GénAI pour les scientifiques des données, les ingénieurs et les responsables des technologies de l'information)
Vamshi Ramarapu
16 novembre 2023

Alors que les organisations cherchent à tirer parti de l IA générativeGénAI), les data scientists, les ingénieurs et les responsables informatiques doivent suivre les meilleures pratiques et utiliser la bonne plateforme de données pour apporter la plus grande valeur et atteindre les résultats souhaités. Alors que de nombreuses meilleures pratiques sont encore en cours d'évolution, GénAI n'en est qu'à ses débuts.
Certes, avec la GénAI, la quantité de données que vous devez préparer peut être incroyablement importante, mais la même approche que vous utilisez actuellement pour préparer et intégrer des données pour d'autres cas d'utilisation, tels que l'analytique avancée ou les applications commerciales, s'applique à la GénAI. Vous devez vous assurer que les données que vous avez recueillies répondront aux besoins de votre cas d'usage en termes de qualité, de formatage et d'exhaustivité.
Comme l'a bien noté TechTarget, "pour utiliser efficacement l'IA générative, les entreprises doivent bien comprendre les meilleures pratiques de gestion des données relatives à la collecte, au nettoyage, à l'étiquetage, à la sécurité et à la gouvernance données".
Construire une base de données pour le GénAI
GénAI est un type d'intelligence artificielle qui utilise des réseaux neuronaux pour découvrir des modèles et des structures dans les données, puis produit du contenu tel que du texte, des images, du son et du code. Si vous avez interagi avec un chatbot en ligne qui donne des réponses semblables à celles d'un humain à des questions ou si vous avez utilisé un programme tel que ChatGPT, vous avez fait l'expérience de la GénAI.
L'impact potentiel de la GénAI est énorme. Gartner estime qu'elle deviendra une technologie polyvalente dont l'impact sera similaire à celui de la machine à vapeur, de l'électricité et de l'internet.
Comme d'autres cas d'utilisation, la GénAI nécessite des données - potentiellement beaucoup de données - et plus encore. Ce "plus" inclut la capacité à support différents formats de données, en plus de la gestion et du stockage des données de manière à les rendre facilement consultables. Vous aurez besoin d'une plateforme évolutif capable de gérer les énormes volumes de données typiquement associés à la GénAI.
L'exactitude des données est indispensable
La préparation et la qualité des données sont essentielles pour la GénAI, tout comme elles le sont pour les processus commerciaux et les analyses fondés sur les données. Comme le souligne eWeek, "la qualité des données obtenues grâce à la technologie de IA générative dépend de la qualité des données que vous utilisez".
La gestion des données apparaît déjà comme un défi pour GénAI. Selon McKinsey, 72 % des organisations déclarent que la gestion des données est un défi majeur qui les empêche d'étendre les cas d'utilisation de l'IA. Comme le note également McKinsey, "si vos données ne sont pas prêtes pour l'IA générative, votre entreprise n'est pas prête pour l'IA générative".
Si les cas d'utilisation de GénAI diffèrent des cas d'usages analytiques traditionnels en termes de résultats et d'applications souhaités, ils ont tous un point commun : le besoin de qualité des données et de capacités d'intégration modernes. La GénAI nécessite des données précises et fiables pour produire des résultats, ce qui n'est pas différent de l'informatique décisionnelle nelle (BI) ou de l'analytique avancée.
Cela signifie que vous devez vous assurer que vos données ne comportent pas d'éléments manquants, qu'elles sont correctement structurées et qu'elles ont été nettoyées. Les données préparées peuvent ensuite être utilisées pour l'apprentissage et le test des modèles GénAI et vous donnent une bonne compréhension des relations entre tous vos ensembles de données.
Il se peut que vous souhaitiez intégrer des données externes à vos données interne dans le cadre de projets GénAI . Les données unifiées peuvent être utilisées pour entraîner modèles de requête votre magasin de données pour les applications GénAI . C'est pourquoi il est important d'utiliser une plateforme de données moderne qui offre de l'évolutivité, peut facilement construire des pipelines vers les sources de données et offre des capacités d'intégration et de qualité des données.
Supprimer les obstacles à la GénAI
Ce que j'entends de la part de nos partenaires Actian, c'est que les organisations intéressées à mettre en œuvre des cas d'utilisation GénAI penchent vers l'utilisation du traitement du language naturel pour les requêtes. Au lieu d'avoir à écrire en SQL pour requête leurs bases de données, les organisations préfèrent souvent utiliser le langage naturel. Un avantage est que vous pouvez également utiliser le langage naturel pour visualiser les données. De même, vous pouvez utiliser le langage naturel pour la surveillance des journaux et pour effectuer d'autres activités qui nécessitaient auparavant des compétences avancées ou des capacités de programmation SQL.
Jusqu'à récemment, et même aujourd'hui dans certains cas, les data scientists créaient un grand nombre de pipelines de données pour ingérer des données provenant de sources actuelles, nouvelles et émergentes. Ils préparaient les données, créaient différentes vues de leurs données et les analysaient pour en tirer des enseignements. GénAI est différent. Il s'agit principalement d'utiliser le traitement du language naturel pour entraîner grands modèles de langage en conjonction avec vos données.
Les organisations veulent toujours créer des pipelines, mais avec une plateforme comme la plateforme de données Actian, il n'est pas nécessaire d'être un data scientist ou d'avoir des compétences informatiques avancées. Les analystes commerciaux peuvent créer des pipelines avec peu ou pas de dépendance à l'égard de l'informatique, ce qui rend plus facile que jamais la collecte de toutes les données nécessaires à la GénAI.
Grâce aux récentes améliorations apportées à notre plateforme de données Actian, nous avons mis en place des options d'intégration low code, no code et pro code. Ces options permettent à la plateforme de s'adresser à un plus grand nombre d'utilisateurs professionnels et de réaliser davantage de cas d'utilisation, y compris ceux qui font appel à la GénAI. Ces options d'intégration réduisent le temps consacré à la préparation des données, permettant aux analystes de données et à d'autres personnes d'intégrer et d'orchestrer les mouvements de données et les pipelines afin d'obtenir rapidement les données dont ils ont besoin.
L'une des meilleures pratiques pour tout cas d'usage est de pouvoir accéder aux données requises, où qu'elles se trouvent. Pour les entreprises modernes, cela signifie qu'il faut pouvoir explorer les données dans le nuage et sur site, ce qui nécessite une plateforme hybride qui connecte et gère les données de n'importe quel environnement, pour n'importe quel cas d'usage.
Élargissement de notre feuille de route pour GénAI
Nos conversations avec les clients ont révélé qu'ils sont enthousiasmés par GénAI et ses solutions et capacités potentielles, mais qu'ils ne sont pas encore tout à fait prêts à mettre en œuvre les technologies GénAI . Ils s'efforcent d'organiser correctement leurs données afin qu'elles soient prêtes lorsqu'ils décideront des cas d'utilisation et des technologies GénAI les mieux adaptés à leurs besoins commerciaux.
Les clients nous disent qu'ils veulent des cas d'utilisation solides qui utilisent la force de GénAI avant d'aller de l'avant. Chez Actian, nous apportons notre aide en collaborant avec les clients et les partenaires pour identifier les bons cas d'utilisation et les solutions les plus optimales pour permettre aux entreprises de réussir. Nous aidons également les clients à s'assurer qu'ils respectent les meilleures pratiques en matière de gestion des données afin qu'ils disposent des bases nécessaires lorsqu'ils seront prêts à aller de l'avant.
En attendant, nous encourageons les clients à tirer parti des atouts de la plateforme de données Actian, tels que nos capacités renforcées d'intégration en tant que service, de qualité des données et de support des bases de données en tant que service. Les clients ont ainsi l'avantage d'obtenir des données en bon état pour les utilisations et les applications de l'IA.
En outre, dans le cadre de notre feuille de route, nous ajoutons des fonctionnalités GénAI à notre portefeuille de produits. Par exemple, nous travaillons actuellement à l'intégration de notre plateforme avec TensorFlow, une plateforme logicielle d'apprentissage machine open-source qui peut compléter GénAI. Nous étudions également la manière dont nos capacités de stockage de données peuvent être utilisées avec TensorFlow afin de garantir que le stockage est optimisé pour les cas d'utilisation de GénAI .
Des données de confiance aux cas d'utilisation de GénAI
En discutant avec des clients, des partenaires et des analystes, et en participant à des événements industriels, nous avons observé que les organisations veulent certainement en savoir plus sur la GénAI et comprendre ses implications et ses applications. Il est désormais largement admis que l'IA et la GénAI Intelligence Artificielle seront essentielles pour les entreprises. Même si la manière dont GénAI sera bénéfique est encore un peu floue, la prise de conscience et l'enthousiasme sont réels.
Nous sommes impatients de voir les types d'applications GénAI qui émergeront et les nombreux cas d'utilisation que nos clients voudront réaliser. Pour l'heure, les entreprises doivent s'assurer qu'elles disposent d'une plateforme de données évolutif capable de gérer les volumes de données requis et qu'elles ont mis en place des pratiques de gestion des données afin de garantir la qualité et la fiabilité des données et d'obtenir les résultats escomptés.
La plateforme de données Actian soutient l'essor des cas d'utilisation avancés tels que l'IA générative en automatisant les tâches de préparation des données qui prennent du temps. Vous pouvez réduire considérablement le temps consacré à l'agrégation des données, au traitement des valeurs manquantes et à la normalisation des données provenant de diverses sources. La capacité de la plateforme à activer des données prêtes pour l'IA vous donne la confiance nécessaire pour entraîner efficacement entraîner modèles d'IA et explorer de nouvelles opportunités pour répondre à vos besoins actuels et futurs. La plateforme de données Actian peut vous donner une confiance totale dans vos données pour les projets GénAI .
Ressources complémentaires :
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.