Ir al contenido
  • HCLSoftware
  • Asistencia
  • Comunidad
  • Descargas
  • Documentación
  • Iniciar sesión
Un logotipo gráfico de la empresa Actian
  • Productos Productos
    • icono azul de datos para Actian

      Datos + Inteligencia Artificial

      Plataforma Actian Data Intelligence Nuevo
      Encuentre, confíe y desbloquee el valor de los datos con una plataforma completa de gobernanza y mercado
      Observabilidad de datos Actian Nuevo
      Calidad y observabilidad de los datos basada en IA para una arquitectura abierta
      Actian Data Platform
      Conecte, gestione y analice sus datos de forma sencilla, con una plataforma unificada.
    • icono azul de base de datos para Actian

      Bases de datos

      • Zen
        Base de datos integrada de bajo mantenimiento
      • Actian NoSQL
        Bases de datos para redes complejas de objetos
      • Actian Ingres
        Procesamiento transaccional escalable y fiable
      • HCL Informix®
        Gestión de datos empresariales rápida y optimizada en costes
    • icono azul de gráfico de líneas para Actian

      Análisis

      • Vector
        Base de datos analítica columnar vectorizada de alto rendimiento
    • integraciones

      Gestión de datos

      • DataConnect
        Solución de integración híbrida muy escalable
      • Calidad de los datos
        Tome decisiones bien fundadas y que impulsan su negocio
      • DataFlow
        Plataforma de ejecución paralela de datos en tránsito
    • Icono azul de gráfico de barras

      Modernización de aplicaciones

      • OpenROAD
        Desarrollo rápido de aplicaciones orientadas a objetos de bases de datos
      • VoltMX
        Plataforma de desarrollo de aplicaciones de poco código
    • Ver todos los productos de Actian
    • cuadrado azul con flecha derecha hacia arriba

      Implementación

      Implementación

      Nube, entornos híbridos e instalaciones

      • Google Cloud Inicie su viaje a Google con Actian
      • Servicios web de Amazon Inicie su viaje a AWS con Actian
      • Microsoft Azure Inicie su viaje a Azure con Actian
    Ver todos los productos de Actian Explore todos los socios de implementación
  • Soluciones Soluciones

    Soluciones por sector

    • Fabricación
    • Transporte y logística
    • Banca, servicios financieros y seguros
    • Sanidad y ciencias de la vida
    • Comercio minorista y bienes de consumo
    • Energía y servicios públicos

    Casos prácticos

    • Icono GenAI
      Preparación de datos para GenAI Una lista rápida de comprobación para evaluar su preparación para la GenAI
    • icono azul  de capa para Actian
      Integración flexible de datos Recopile, transforme y automatice las canalizaciones de datos
    • icono azul de base de datos
      Modernización del almacén de datos Migración simplificada y de bajo riesgo a un almacén de datos moderno, implementado en las instalaciones y en varias nubes
    • icono azul de soluciones de comunicación
      Enterprise Data Marketplace Descubra productos de datos, acceda a ellos y compártalos
    • icono azul de nube para Actian
      Análisis del borde a la nube Modernice el procesamiento y análisis de datos de aplicaciones en el borde
    • icono azul de gráfico de flujo de datos para Actian
      Centro de análisis de datos de clientes Obtenga información del cliente procesable en tiempo real, de todos sus silos de datos de experiencia de cliente
    Explore todas las soluciones del sector
  • Clientes Clientes

    Clientes

    • icono azul de usuarios para actian
      Nuestros clientes Únase a una creciente comunidad de empresas de diversos sectores que confían en Actian para aprovechar el poder de sus datos.

    Casos de éxito de clientes

    • icono azul de usuario para actian
      Academy Bank
    • icono azul de usuario para actian
      Tsubakimoto
    Ver todos los clientes
  • Socios Socios

    Socios

    • icono azul de cuadrado de información para Actian
      Resumen del programa Soluciones competitivas, incentivos líderes en el sector y un completo paquete de asistencia
    • icono azul de verificación para Actian
      Hágase socio Acelere su negocio con el Programa de Socios de Actian
    • icono azul Bezier para Actian
      Socios tecnológicos Asociarse para crear un multiplicador de fuerzas
    • icono azul de usuario para actian
      Recomiende a un cliente potencial Proteja a su cliente, haga crecer su negocio
    • Icono de búsqueda de socios
      Busque un socio Aproveche la experiencia y los conocimientos de nuestra red de socios
  • Aprenda Aprenda

    Aprenda

    • Icono de sangría izquierda de imagen
      Blog
    • icono azul de gorro de graduación
      Academia Actian
    • icono azul de libro
      Recursos
    • icono azul con papel y lupa para Actian
      Guías
    • cuadrado azul
      Seminarios en línea
    • logotipo azul de lista
      Glosario
    Ver todos los recursos
  • Empresa Empresa

    Empresa

    • logotipo azul de Actian
      Quiénes somos
    • icono azul de anuncio
      Redacción
    • icono azul de pregunta
      Acerca de HCLSoftware
    • icono azul de maletín para Actian
      Carreras profesionales
    • icono azul de usuarios de Actian
      Liderazgo
    • icono azul de verificación para Actian
      Premios y reconocimientos
    • Icono azul de calendario
      Eventos
    • icono azul de mensaje
      Contacte con nosotros
    Más información sobre Actian
Visita guiada Solicitar demostración Iniciar sesión
  • Asistencia
  • Comunidad
  • Descargas
  • Documentación
  • HCLSoftware
Más información sobre nuestras soluciones de datos
Contacte con nosotros
Inteligencia de datos

Marquez: La solución de descubrimiento de metadatos en WeWork

Corporación Actian

10 de diciembre de 2020

Marquez v2 ES

Últimas entradas del blog

Manténgase al día de las últimas tendencias en datos

Suscríbase a

Creada en 2010, WeWork es una empresa global de alquiler de oficinas y espacios de trabajo. Su objetivo es proporcionar espacios de colaboración a equipos de cualquier tamaño, ya sean startups, pymes o grandes empresas. Para lograrlo, lo que WeWork ofrece puede dividirse en tres categorías diferentes:

  • Espacio: Para garantizar a las empresas un espacio óptimo, WeWork debe proporcionar la infraestructura adecuada, que consiste en reservar salas para entrevistas / one on ones o incluso edificios enteros para grandes corporaciones. También deben asegurarse de que están equipados con las instalaciones adecuadas, como cocinas para el almuerzo y las pausas para el café, baños, etc.
  • Comunidad: A través de la aplicación interna de WeWork, la empresa permite a los miembros de WeWork conectarse entre sí, ya sea localmente dentro de su propio espacio WeWork, o globalmente. Por ejemplo, si una empresa necesita opiniones para un proyecto de determinados puestos de trabajo (como un desarrollador o un diseñador de UX), puede pedir directamente opiniones y sugerencias a través de la aplicación a cualquier miembro, independientemente de su ubicación.
  • Servicios: WeWork también ofrece a sus miembros servicios informáticos completos en caso de problemas, así como otros servicios como nóminas, servicios públicos, etc.

En 2020, WeWork representa:

  • Más de 600.000 afiliaciones.
  • Ubicaciones en 127 ciudades de 33 países diferentes.
  • 850 oficinas en todo el mundo.
  • Generó unos ingresos de 1.820 millones de dólares.

Está claro que WeWork trabaja con todo tipo de datos de su personal y sus clientes, ya sean particulares o empresas. Por lo tanto, la enorme empresa necesitaba una plataforma en la que sus expertos en datos pudieran ver, recopilar, agregar y visualizar los metadatos de su ecosistema de datos. Esto se resolvió con la creación de Marquez.

Este artículo se centrará en la implementación de Márquez por parte de WeWork, principalmente a través de documentación gratuita y accesible proporcionada en varios sitios web, para ilustrar la importancia de contar con una plataforma de metadatos en toda la empresa con el fin de convertirse realmente en data-driven.  

¿Por qué gestionar y utilizar metadatos?

En su charla "A Metadata Service for Data Abstraction, Data Lineage & Event-based Triggers" en el Data Council allá por 2018, Willy Lulciuc, Ingeniero de Software del proyecto Marquez en WeWork explicó que los metadatos son cruciales por tres razones:

  • Garantizar la calidad de los datos: Cuando los datos no tienen contexto, es difícil que los ciudadanos confíen en sus activos de datos: ¿faltan campos? ¿Está actualizada la documentación? ¿Quién es el propietario de los datos y sigue siéndolo? Estas preguntas se responden mediante el uso de metadatos.
  • Comprender el linaje de los datos: Conocer los orígenes y las transformaciones de tus datos es clave para poder saber realmente por qué etapas han pasado tus datos a lo largo del tiempo.
  • Democratización de los conjuntos de datos: Según Willy Lulciuc, la democratización de los datos en la empresa es fundamental. Disponer de un portal central o una interfaz de usuario para que los usuarios puedan buscar y explorar sus conjuntos de datos es una de las formas más importantes que tienen las empresas de crear una verdadera cultura de autoservicio de datos.

En resumen: crear un ecosistema de datos saludable. Willy explica que ser capaz de gestionar y utilizar metadatos crea una cultura de datos sostenible en la que las personas ya no necesitan pedir ayuda para encontrar y trabajar con los datos que necesitan. En su diapositiva, repasa tres categorías diferentes que conforman un ecosistema de datos saludable:

  1. Ser un ecosistema de autoservicio, donde los usuarios de datos y de negocio tienen la posibilidad de descubrir los datos y metadatos que necesitan, y explorar los activos de datos de la empresa cuando no saben exactamente lo que están buscando. Proporcionar datos contextualizados permite a todos los usuarios y ciudadanos de datos trabajar eficazmente en sus casos de uso de datos.
  2. Ser autosuficientes permitiendo a los usuarios de datos la libertad de experimentar con sus conjuntos de datos, así como tener la flexibilidad de trabajar en todos los aspectos de sus conjuntos de datos, ya sean de entrada o de salida, por ejemplo.
  3. Y, por último, en lugar de depender de determinadas personas o grupos, un ecosistema de datos saludable permite que todos los empleados sean responsables de sus propios datos. Cada usuario tiene la responsabilidad de conocer sus datos, sus costes (¿están estos datos produciendo suficiente valor?), así como de hacer un seguimiento de la documentación de sus datos para generar confianza en torno a sus conjuntos de datos.

Reserva de habitaciones Antes

Como ya se ha dicho, la utilización de metadatos es crucial para que los usuarios de datos puedan encontrar los datos que necesitan. En su presentación, Willy compartió una situación real para demostrar que los metadatos son esenciales: El proceso de datos de WeWork para reservar una habitación.

Para un "WeWorker", los pasos son los siguientes:

  1. Busca una ubicación (el ejemplo era un complejo de edificios en San Francisco).
  2. Elegir el tamaño adecuado de la sala (normalmente se divide en función del número de asistentes; en este caso eligieron una sala que podía acoger de 1 a 4 personas).
  3. Elija la fecha en la que se realizará la reserva.
  4. Decide la franja horaria para la que se reserva la sala, así como la duración de la reunión.
  5. Confirme la reserva.

Ahora que tenemos un ejemplo de cómo funciona su canal de reservas, Willy procede a demostrar cómo funcionaría un equipo de datos típico que quisiera extraer datos sobre las reservas de WeWork. En este caso, el ejercicio de ejemplo consistía en encontrar el edificio con más reservas de habitaciones y extraer esos datos para enviarlos a la dirección. Los pasos que indicó fueron los siguientes:

  • Leer las reservas de habitaciones de una fuente de datos (normalmente desconocida).
  • Suma todas las reservas de habitaciones y devuelve las mejores ubicaciones.
  • Una vez calculada la ubicación superior, el siguiente paso es escribirla en alguna fuente de datos de salida.
  • Ejecuta el trabajo una vez cada hora.
  • Procesa los datos mediante archivos .csv y almacénalos en algún sitio.

Sin embargo, Willy afirma que, aunque estos pasos parezcan suficientes, suelen surgir problemas. Repasa tres tipos de problemas durante el proceso de trabajo:

  1. ¿Dónde puedo encontrar el conjunto de datos de entrada de trabajo?
  2. ¿Tiene propietario el conjunto de datos? ¿Quién es?
  3. ¿Con qué frecuencia se actualiza el conjunto de datos?

La mayoría de estas preguntas son difíciles de responder y los trabajos acaban fracasando. Sin estar seguro y confiar en esta información, puede ser difícil presentar números a la dirección. Este tipo de problemas y cuestiones son los que hicieron que WeWork desarrollara Marquez.

¿Qué es Márquez?

Willy define la plataforma como una "solución de código abierto para la agregación, recopilación y visualización de metadatos del ecosistema de datos [de WeWork]". De hecho, Marquez es un sistema modular y se diseñó como una solución para la gestión de metadatos altamente escalable y extensible independientemente de la plataforma. Consta de los siguientes componentes

  • Repositorio de metadatos: Almacena todos los metadatos de trabajos y conjuntos de datos, incluido un historial completo de ejecuciones de trabajos y estadísticas a nivel de trabajo (es decir, ejecuciones totales, tiempos medios de ejecución, éxitos/fracasos, etc.).
  • API de metadatos: API RESTful que permite a un conjunto diverso de clientes comenzar a recopilar metadatos en torno a la producción y el consumo de conjuntos de datos.
  • Interfaz de metadatos: Se utiliza para descubrir conjuntos de datos, conectar múltiples conjuntos de datos y explorar su gráfico de dependencias.

Diseño de Márquez

Marquez proporciona clientes específicos para cada idioma que implementan la API de metadatos. Esto permite a un conjunto diverso de aplicaciones de procesamiento de datos crear una colección de metadatos. En su versión inicial, ofrecían soporte tanto para Java como para Python.

La API de metadatos extrae información sobre la producción y el consumo de conjuntos de datos. Es una capa sin estado responsable de especificar tanto la persistencia como la agregación de metadatos. La API permite a los clientes recopilar y/u obtener información sobre conjuntos de datos del repositorio de metadatos.

Los metadatos deben recopilarse, organizarse y almacenarse de forma que permitan realizar consultas exploratorias a través de la interfaz de usuario de metadatos. El repositorio de metadatos sirve como catálogo de la información del conjunto de datos encapsulada y limpiamente abstraída por la API de metadatos.

Según Willy, lo que hace que un ecosistema de datos sea muy sólido es la capacidad de buscar información y conjuntos de datos. En Márquez, los conjuntos de datos se indexan y clasifican mediante el uso de una palabra o frase clave basada en un motor de búsqueda, así como en la documentación de un conjunto de datos: cuanto más contextualizado esté un conjunto de datos, más probabilidades tendrá de aparecer el primero en los resultados de búsqueda. Ejemplos de la documentación de un conjunto de datos son su descripción, propietario, esquema, etiqueta, etc.

Puede ver más detalles del modelo de datos de Márquez en la propia presentación aquí: https://www.youtube.com/watch?v=dRaRKob-lRQ&ab_channel=DataCouncil

El futuro de la gestión de datos en WeWork

Dos años después del proyecto, Márquez ha demostrado ser de gran ayuda para la gigantesca empresa de leasing. Su hoja de ruta a largo plazo es centrarse únicamente en la interfaz de usuario de su solución, incluyendo más visualizaciones y representaciones gráficas para ofrecer a los usuarios formas más sencillas y divertidas de interactuar con sus datos.

También ofrecen varias comunidades en línea a través de su página de Github, así como grupos en LinkedIn para que los interesados en Marquez hagan preguntas, reciban consejos o incluso informen de problemas en la versión actual de Marquez.

Fuentes

A Metadata Service for Data Abstraction, Data Lineage & Event-Based Triggers, WeWork. Youtube: https://www.youtube.com/watch?v=dRaRKob-lRQ&ab_channel=DataCouncil

29 asombrosas estadísticas de WeWork - La nueva era del coworking, TechJury.com: https://techjury.net/blog/wework-statistics/

Márquez: Recopilar, agregar y visualizar los metadatos de un ecosistema de datos, https://marquezproject.github.io/marquez/

Marquez: un servicio de metadatos de código abierto para plataformas de ML Willy Lulciuc
logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.
  • métadonnées Gestión
  • Compartir con Icono de Twitter
  • Compartir conIcono de LinkedIn
  • Compartir conIcono de Facebook
  • Compartir conIcono de correo

Suscríbase al blog de Actian

Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.

  • Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
  • No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
  • Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.

Suscríbase a

Esta extensión de correo electrónico () no está permitida. Por favor, actualícela.
Este dominio de dirección de correo electrónico personal () no está permitido. Por favor, actualícelo.

Gracias por suscribirse al blog de Actian.

Prepárese para mantenerse informado e inspirado con las últimas ideas, tendencias y actualizaciones en el mundo del análisis de datos y la tecnología.

Pronto recibirá en su bandeja de entrada nuestros artículos, estudios de casos y noticias del sector, cuidadosamente seleccionados.

También puede interesarle:
  • Inteligencia de datos para unas decisiones más inteligentes
  • ¿Está su organización preparada para la GenAI?
  • Obtenga una visión completa del cliente

Datos + Inteligencia Artificial

  • Plataforma de inteligencia de datos Actian
  • Actian Data Observability
  • Actian Data Platform

Capacidades

  • Análisis de datos
  • Bases de datos
  • Integración y calidad de datos
  • Servicios de aplicación

Soluciones

  • Fabricación
  • Servicios financieros
  • Análisis de datos sanitarios
  • Transporte y logística
  • Comunicaciones

Empresa

  • Acerca de Actian
  • Acerca de HCLSoftware
  • Eventos
  • Premios y reconocimientos
  • Redacción
  • Prensa
  • Carreras profesionales
  • Ubicaciones

Clientes

  • Asistencia
  • Comunidad
  • Documentación
  • Iniciar sesión en el portal del cliente
  • Iniciar sesión en Actian Data Platform

Comenzar

  • Solicite una demostración
  • Contacte con nosotros
Actian
© 2025 Actian Corporation. Todos los derechos reservados.
  • icono social x
  • facebook
  • Linkedin
  • GitHub
  • youtube
  • Condiciones de uso
  • Política sobre esclavitud moderna
  • Política de privacidad
  • Directrices sobre marcas registradas
  • Patentes
  • Seguridad
logotipo-hcl