Gestion des données

Les outils pour développeurs d'Actian sont disponibles sur Github

Actian Corporation

28 avril 2016

Les outils de développement d'Actian sont disponibles sur github

Les équipes technologiques d'Actian ont récemment publié un certain nombre d'outils techniques et d'extraits sur le compte Actian de Github qui intéresseront les clients, les partenaires et les clients potentiels. Nous vous encourageons tous à y jeter un coup d'œil et à faire vos propres contributions - soit pour améliorer ces outils, soit pour nous faire connaître d'autres outils que vous avez créés pour vous-mêmes, et nous les mentionnerons ici. Nous avons l'intention de publier de nouvelles contributions ici au fil du temps, et de publier de futurs articles de blog qui entreront dans le détail de certains de ces outils et contributions.

Voici quelques exemples de projets que vous pouvez déjà trouver sur GitHub:

  • Le connecteur Actian Spark pour Vector dans Hadoop (VectorH) est maintenu ici.
  • Un paquetage Vagrant qui prendra un fichier Vector .tgz téléchargé et l'installera automatiquement dans une machine virtuelle CentOS fraîchement construite.
  • Un cadre de test unitaire pour OpenROAD.
  • Une collection de scripts pour tester VectorH avec d'autres moteurs d'analyse de données Hadoop, référencés dans le cadre d'un article de conférence à venir.
  • Un modèle basé sur Maven pour créer de nouveaux opérateurs personnalisés dans Dataflow, ainsi que quelques exemples qui utilisent ce modèle, y compris un analyseur d'expressions JSONpath de Dataflow et un analyseur XML et XPath.
  • Un utilitaire appelé MQI, conçu pour faciliter l'exécution d'une commande du système d'exploitation sur tous les nœuds d'un Cluster Hadoop VectorH Cluster Hadoop.
  • Une collection de petits outils vectoriels qui permettent de calculer le nombre de partitions par défaut pour une grande table, de rechercher des asymétries de données dans une table, de vérifier si les index min/max du vecteur sont triés ou non (les performances sont meilleures si les données sont triées sur le disque et les index min/max le montrent), ainsi qu'un outil permettant de prendre une collection de scripts SQL et de les transformer en un test de débit d'utilisateur simultanés, avec des statistiques sur le temps d'exécution global.
  • Une collection de nouveaux opérateurs pour Dataflow afin d'implémenter des opérations telles que le passage de paramètres d'exécution dans un Dataflow en tant que service, et un opérateur 'sesssionize' pour regrouper des données horodatées en 'sessions', et un nœud lead/lag pour gérer des données horodatées, et d'autres encore.
  • Une suite de tests de performance pour Actian Vector, basée sur les données de test et les requêtes DBT3. Ce projet créera des données de test à un facteur d'échelle que vous choisirez (le facteur d'échelle par défaut est 1, ce qui représente environ 1 Go de données au total), chargera ces données de test dans Vector/VectorH, puis exécutera une série de requêtes et chronométrera les résultats.

Jetez-y un coup d'œil, téléchargez-les et contribuez à les étendre et à les améliorer pour qu'ils répondent à vos besoins !

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.