Actian Life

Steffen Kläbe remporte le prix du meilleur article à la conférence EDBT/ICDT 2023

Actian Corporation

19 avril 2023

Steffen remporte le prix du meilleur article à la conférence

Nous aimerions rendre hommage à Steffen Kläbe, ingénieur de recherche chez Actian à llmenau (Thuringe, Allemagne). Il a participé à la conférence conjointe EDBT/ICDT 2023 en Grèce, l'une des plus importantes conférences sur les bases de données au monde, où il a présenté deux documents de recherche. Pour sa recherche sur Patched Multi-Key Partitioning for Robust requête Performance il a reçu le prix du meilleur article. Dans la communauté des chercheurs, ce prix est un véritable succès.

Voir le résumé : 

"Le partitionnement des données est la clé du traitement parallèle des requête dans les systèmes modernes de bases de données analytiques. Le choix de la bonne clé de partitionnement pour un jeu de données donné est une tâche difficile et cruciale pour la performance des requête . Les entrepôts de données du monde réel contiennent un grand nombre de tables connectées selon des schémas complexes, ce qui se traduit par une quantité écrasante de candidats à la clé de partitionnement. Dans cet article, nous présentons l'approche du partitionnement multi-clé patché, qui permet de définir simultanément plusieurs clés de partition sans réplication des données. L'idée principale consiste à transposer le problème de partitionnement des tables relationnelles en un problème de partitionnement des graphes afin d'utiliser les algorithmes de partitionnement des graphes existants pour trouver des composants de connectivité dans les données et maintenir séparément les exceptions (correctifs) au partitionnement. Nous montrons que le partitionnement à clés multiples avec correctifs permet d'obtenir des performances robustes en matière de requête , c'est-à-dire d'atteindre des performances raisonnablement bonnes pour de nombreuses requêtes au lieu d'obtenir des performances optimales pour quelques requêtes seulement."

Article complémentaire deKläbe Exploration des approches pour la ML dans les bases de données couvre le rôle croissant de l'intégration des modèles de ML dans des cadres spécialisés pour la classification ou la prédiction.

Voir le résumé :

"Les systèmes de base de données ne sont plus utilisés uniquement pour le stockage de données structurées simples et les analyses de base. Un rôle croissant est également joué par l'intégration de modèles de ML, par exemple les réseaux neuronaux avec des cadres spécialisés, et leur utilisation pour la classification ou la prédiction. Cependant, l'utilisation de ces modèles sur des données stockées dans un système de base de données peut nécessiter le téléchargement des données et l'exécution des calculs à l'extérieur. Dans cet article, nous évaluons les approches permettant d'intégrer l'étape d'inférence ML en tant qu'opérateur de requête spécial - le ModelJoin. Nous explorons plusieurs options pour cette intégration à différents niveaux d'abstraction : la représentation relationnelle des modèles ainsi que les requêtes SQL pour l'inférence, l'utilisation de FDU, l'utilisation d'APIs pour les runtimes ML existants et une implémentation native du ModelJoin en tant qu'opérateur de requête supportant à la fois l'exécution par processeur et par GPU. Nos résultats d'évaluation montrent que l'intégration d'exécutions de ML par le biais d'API donne des résultats similaires à ceux d'un opérateur natif tout en étant générique pour support types de modèles arbitraires. La solution de la représentation relationnelle et des requêtes SQL est la plus portable et fonctionne bien pour des entrées plus petites sans qu'aucun changement ne soit nécessaire dans le moteur de base de données."

Félicitations, Steffan ! Nous attendons avec impatience de voir d'autres de tes victoires et de tes recherches à l'avenir.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.