Gestión de datos

Herramientas para desarrolladores de Actian disponibles en Github

Corporación Actian

28 de abril de 2016

Herramientas para desarrolladores de Actian disponibles en github

Los equipos de tecnología de Actian han publicado recientemente una serie de herramientas técnicas y fragmentos en la cuenta de Actian en Github que serán de interés para los clientes, socios y clientes potenciales. Os animamos a todos a que echéis un vistazo y hagáis vuestras propias contribuciones, ya sea para mejorar estas herramientas o para darnos a conocer otras que hayáis creado vosotros mismos, y las mencionaremos aquí. Nuestra intención es publicar aquí nuevas contribuciones a lo largo del tiempo, así como futuras entradas del Blog que profundicen en algunas de estas herramientas y contribuciones.

Algunos ejemplos de los proyectos que ya se pueden encontrar en GitHub son:

  • El conector Actian Spark para Vector en Hadoop (VectorH) se mantiene aquí.
  • Un paquete Vagrant que tomará un archivo .tgz de Vector descargado y lo instalará automáticamente en una máquina virtual CentOS recién construida.
  • Un marco de pruebas unitarias para OpenROAD.
  • Una colección de scripts para probar VectorH junto con otros motores de análisis de datos Hadoop, a los que se hace referencia como parte de una ponencia de próxima publicación.
  • Una plantilla basada en Maven para crear nuevos operadores personalizados en Dataflow, junto con un par de ejemplos que utilizan esta plantilla, incluyendo un analizador de expresiones JSONpath de Dataflow y un analizador XML y XPath.
  • Una utilidad llamada MQI que está diseñada para facilitar la ejecución de un comando del sistema operativo en todos los nodos de un VectorH Cluster Hadoop.
  • Una colección de pequeñas herramientas Vector que harán cosas como calcular el número apropiado de particiones por defecto para una tabla grande, buscar datos sesgados dentro de una tabla, comprobar si los índices Vector min/max están ordenados o no (mejor rendimiento si sus datos están ordenados en el disco y los índices min/max lo mostrarán), y también una herramienta para tomar una colección de scripts SQL y convertirlos en una prueba de rendimiento de usuarios concurrentes, completa con algunas estadísticas sobre el tiempo de ejecución total.
  • Una colección de nuevos operadores para Dataflow para implementar operaciones como pasar parámetros en tiempo de ejecución a un Dataflow como servicio, y un operador 'sesssionize' para agrupar datos con marca de tiempo en 'sesiones', y un nodo lead/lag para manejar datos con marca de tiempo, y varios otros.
  • Un conjunto de pruebas de rendimiento para Actian Vector, basado en los datos de prueba y consultas DBT3. Este proyecto creará datos de prueba en un factor de escala que usted elija (por defecto es el Factor de Escala 1, que es alrededor de 1Gb de datos en total), carga los datos de prueba en Vector/VectorH, y luego ejecuta una serie de consultas y cronometra los resultados.

Eche un vistazo, descárguelos y contribuya a ampliarlos y mejorarlos para satisfacer sus necesidades.

logo avatar actian

Acerca de Actian Corporation

Actian hace que los datos sean fáciles. Nuestra plataforma de datos simplifica el modo en que las personas conectan, gestionan y analizan los datos en entornos en la nube, híbridos y locales. Con décadas de experiencia en gestión de datos y análisis, Actian ofrece soluciones de alto rendimiento que permiten a las empresas tomar decisiones basadas en datos. Actian cuenta con el reconocimiento de los principales analistas y ha recibido premios del sector por su rendimiento e innovación. Nuestros equipos comparten casos de uso probados en conferencias (por ejemplo, Strata Data) y contribuyen a proyectos de código abierto. En el blog de Actian, cubrimos temas que van desde la ingestión de datos en tiempo real hasta el análisis impulsado por IA.