Gestion des données

Les outils pour développeurs d'Actian sont disponibles sur Github

Actian Corporation

28 avril 2016

Les outils de développement d'Actian sont disponibles sur github

Les équipes technologiques d'Actian ont récemment publié un certain nombre d'outils techniques et d'extraits sur le compte Actian de Github qui intéresseront les clients, les partenaires et les clients potentiels. Nous vous encourageons tous à y jeter un coup d'œil et à faire vos propres contributions - soit pour améliorer ces outils, soit pour nous faire connaître d'autres outils que vous avez créés pour vous-mêmes, et nous les mentionnerons ici. Nous avons l'intention de publier de nouvelles contributions ici au fil du temps, et de publier de futurs articles de blog qui entreront dans le détail de certains de ces outils et contributions.

Voici quelques exemples de projets que vous pouvez déjà trouver sur GitHub:

  • Le connecteur Actian Spark pour Vector dans Hadoop (VectorH) est maintenu ici.
  • Un paquetage Vagrant qui prendra un fichier Vector .tgz téléchargé et l'installera automatiquement dans une machine virtuelle CentOS fraîchement construite.
  • Un cadre de test unitaire pour OpenROAD.
  • Une collection de scripts pour tester VectorH avec d'autres moteurs d'analyse de données Hadoop, référencés dans le cadre d'un article de conférence à venir.
  • Un modèle basé sur Maven pour créer de nouveaux opérateurs personnalisés dans Dataflow, ainsi que quelques exemples qui utilisent ce modèle, y compris un analyseur d'expressions JSONpath de Dataflow et un analyseur XML et XPath.
  • Un utilitaire appelé MQI, conçu pour faciliter l'exécution d'une commande du système d'exploitation sur tous les nœuds d'un Cluster Hadoop VectorH Cluster Hadoop.
  • Une collection de petits outils vectoriels qui permettent de calculer le nombre de partitions par défaut pour une grande table, de rechercher des asymétries de données dans une table, de vérifier si les index min/max du vecteur sont triés ou non (les performances sont meilleures si les données sont triées sur le disque et les index min/max le montrent), ainsi qu'un outil permettant de prendre une collection de scripts SQL et de les transformer en un test de débit d'utilisateur simultanés, avec des statistiques sur le temps d'exécution global.
  • Une collection de nouveaux opérateurs pour Dataflow afin d'implémenter des opérations telles que le passage de paramètres d'exécution dans un Dataflow en tant que service, et un opérateur 'sesssionize' pour regrouper des données horodatées en 'sessions', et un nœud lead/lag pour gérer des données horodatées, et d'autres encore.
  • Une suite de tests de performance pour Actian Vector, basée sur les données de test et les requêtes DBT3. Ce projet créera des données de test à un facteur d'échelle que vous choisirez (le facteur d'échelle par défaut est 1, ce qui représente environ 1 Go de données au total), chargera ces données de test dans Vector/VectorH, puis exécutera une série de requêtes et chronométrera les résultats.

Jetez-y un coup d'œil, téléchargez-les et contribuez à les étendre et à les améliorer pour qu'ils répondent à vos besoins !

logo avatar actian

À propos d'Actian Corporation

Actian donne aux entreprises les moyens de gérer et de gouverner en toute confiance les données à l'échelle. Les solutions d'intelligence des données d'Actian aident à rationaliser les environnements de données complexes et à accélérer la fourniture de données prêtes pour l'IA. Conçues pour être flexibles, les solutions d'Actian s'intègrent de manière transparente et fonctionnent de manière fiable dans les environnements sur site, cloud et hybrides. Pour en savoir plus sur Actian, la division données de HCLSoftware, rendez-vous sur actian.com.