Gestión de datos

Herramientas para desarrolladores de Actian disponibles en Github

Corporación Actian

28 de abril de 2016

Herramientas para desarrolladores de Actian disponibles en github

Los equipos de tecnología de Actian han publicado recientemente una serie de herramientas técnicas y fragmentos en la cuenta de Actian en Github que serán de interés para los clientes, socios y clientes potenciales. Os animamos a todos a que echéis un vistazo y hagáis vuestras propias contribuciones, ya sea para mejorar estas herramientas o para darnos a conocer otras que hayáis creado vosotros mismos, y las mencionaremos aquí. Nuestra intención es publicar aquí nuevas contribuciones a lo largo del tiempo, así como futuras entradas del Blog que profundicen en algunas de estas herramientas y contribuciones.

Algunos ejemplos de los proyectos que ya se pueden encontrar en GitHub son:

  • El conector Actian Spark para Vector en Hadoop (VectorH) se mantiene aquí.
  • Un paquete Vagrant que tomará un archivo .tgz de Vector descargado y lo instalará automáticamente en una máquina virtual CentOS recién construida.
  • Un marco de pruebas unitarias para OpenROAD.
  • Una colección de scripts para probar VectorH junto con otros motores de análisis de datos Hadoop, a los que se hace referencia como parte de una ponencia de próxima publicación.
  • Una plantilla basada en Maven para crear nuevos operadores personalizados en Dataflow, junto con un par de ejemplos que utilizan esta plantilla, incluyendo un analizador de expresiones JSONpath de Dataflow y un analizador XML y XPath.
  • Una utilidad llamada MQI que está diseñada para facilitar la ejecución de un comando del sistema operativo en todos los nodos de un VectorH Cluster Hadoop.
  • Una colección de pequeñas herramientas Vector que harán cosas como calcular el número apropiado de particiones por defecto para una tabla grande, buscar datos sesgados dentro de una tabla, comprobar si los índices Vector min/max están ordenados o no (mejor rendimiento si sus datos están ordenados en el disco y los índices min/max lo mostrarán), y también una herramienta para tomar una colección de scripts SQL y convertirlos en una prueba de rendimiento de usuarios concurrentes, completa con algunas estadísticas sobre el tiempo de ejecución total.
  • Una colección de nuevos operadores para Dataflow para implementar operaciones como pasar parámetros en tiempo de ejecución a un Dataflow como servicio, y un operador 'sesssionize' para agrupar datos con marca de tiempo en 'sesiones', y un nodo lead/lag para manejar datos con marca de tiempo, y varios otros.
  • Un conjunto de pruebas de rendimiento para Actian Vector, basado en los datos de prueba y consultas DBT3. Este proyecto creará datos de prueba en un factor de escala que usted elija (por defecto es el Factor de Escala 1, que es alrededor de 1Gb de datos en total), carga los datos de prueba en Vector/VectorH, y luego ejecuta una serie de consultas y cronometra los resultados.

Eche un vistazo, descárguelos y contribuya a ampliarlos y mejorarlos para satisfacer sus necesidades.

logo avatar actian

Acerca de Actian Corporation

Actian permite a las empresas gestionar y gobernar con confianza los datos a escala, agilizando los entornos de datos complejos y acelerando la entrega de datos listos para la IA. El enfoque de inteligencia de datos de Actian combina el descubrimiento de datos, la gestión de metadatos y la gobernanza federada para permitir un uso más inteligente de los datos y mejorar el cumplimiento. Con capacidades intuitivas de autoservicio, los usuarios empresariales y técnicos pueden encontrar, comprender y confiar en los activos de datos en entornos en la nube, híbridos y locales. Actian ofrece soluciones flexibles de gestión de datos a 42 millones de usuarios en empresas de Fortune 100 y otras empresas de todo el mundo, al tiempo que mantiene una puntuación de satisfacción del cliente del 95%.