Zum Inhalt springen
  • HCLSoftware
  • Support
  • Community
  • Downloads
  • Dokumentation
  • Login
Ein Grafik-Logo der Firma Actian
  • Produkte Produkte
    • blaues Daten-Symbol für Actian

      Daten + KI-Intelligenz

      Actian Data Intelligence Platform Neu
      Finden und vertrauen Sie Daten und erschließen Sie sich deren volles Potenzial mit einer umfassenden Governance- und Marketplace-Plattform
      Actian Data Observability Neu
      KI-basierte Datenqualität und Observability für eine offene Architektur
      Actian Data Platform
      Einfaches Verbinden, Verwalten und Analysieren von Daten über eine einheitliche Plattform
    • blaues Datenbank-Symbol für Actian

      Datenbanken

      • Zen
        Pflegeleichte eingebettete Datenbank
      • Actian NoSQL
        Datenbanken für komplexe Objektnetzwerke
      • Actian Ingres
        Skalierbare und zuverlässige Transaktionsverarbeitung
      • HCL Informix®
        Schnelle, kostensparende Verwaltung von Unternehmensdaten
    • blaues Liniendiagramm-Symbol für Actian

      Analytik

      • Vektor
        Leistungsstarke, vektorisierte spaltenbasierte Analytics-Datenbank
    • Integrationen

      Datenmanagement

      • DataConnect
        Hochgradig skalierbare hybride Integrationslösung
      • Datenqualität
        Treffen Sie fundierte Entscheidungen, die Ihr Unternehmen voranbringen
      • DataFlow
        Parallele Ausführungsplattform Data-in-Motion
    • blaues Balkendiagramm-Symbol

      App-Modernisierung

      • OpenROAD
        Datenbank, objektorientierte schnelle Anwendungsentwicklung
      • VoltMX
        Entwicklungsplattform für Anwendungen mit geringem Code
    • Alle Actian Produkte anzeigen
    • blaues Quadrat mit Rechtspfeil nach oben

      Deployment

      Deployment

      In der Cloud, hybrid und On-Premises

      • Google Cloud Starten Sie Ihre Migration zu Google mit Actian
      • Amazon Web Services Starten Sie Ihre Migration zu AWS mit Actian
      • Microsoft Azure Starten Sie Ihre Migration zu Azure mit Actian
    Alle Actian Produkte anzeigen Alle Deployment-Partner kennenlernen
  • Lösungen Lösungen

    Lösungen nach Branche

    • Fertigung
    • Transport und Logistik
    • Bankwesen, Finanzdienstleistungen und Versicherungen
    • Gesundheitswesen und Biowissenschaften
    • Einzelhandel und Konsumgüter
    • Energie und Versorgungsunternehmen

    Use Cases

    • GenAI-Symbol
      GenAI Data Readiness Eine kurze Checkliste zur Bewertung Ihrer GenAI-Bereitschaft
    • blaues Ebenensymbol für Actian
      Flexible Datenintegration Sammeln, Umwandeln und Automatisieren von Datenpipelines
    • Datenbank blaues Symbol
      Daten-Warehouse-Modernisierung Risikoarme, vereinfachte Migration zu einem modernen Data Warehouse, bereitgestellt On-Premises und in verschiedenen Clouds
    • Symbol für blaue Kommunikationslösungen
      Marktplatz für Unternehmensdaten Datenprodukte entdecken, abrufen und gemeinsam nutzen
    • blaues Wolkensymbol für Actian
      Edge-to-Cloud-Analytik Modernisieren Sie die Verarbeitung und Analyse von Anwendungsdaten am Edge
    • blaues Datenflussdiagramm-Symbol für Actian
      Kundendaten-Analyse-Hub Erhalten Sie umsetzbare Customer Intelligence in Echtzeit über all Ihre CX-Datensilos
    Alle Branchenlösungen kennenlernen
  • Kunden Kunden

    Kunden

    • blaues Benutzersymbol für Actian
      Unsere Kunden Werden Sie Teil einer wachsenden Community von Unternehmen, die darauf vertrauen, dass Actian das Potenzial ihrer Daten freisetzt

    Ausgewählte Customer Storys

    • blaues Nutzer-Symbol für Actian
      Academy Bank
    • blaues Nutzer-Symbol für Actian
      Tsubakimoto
    Alle Kunden anzeigen
  • Partner Partner

    Partner

    • blaues Info-Quadrat-Symbol für Actian
      Programm-Übersicht Wettbewerbsfähige Lösungen, branchenführende Anreize und ein umfassendes Support-Paket
    • blaues Häkchensymbol für Actian
      Werden Sie Partner Kurbeln Sie Ihr Business an mit dem Actian Partner-Programm
    • blaues Bezier-Symbol für Actian
      Technologie-Partner Partnerschaften mit Multiplikatoreffekt
    • blaues Nutzer-Symbol für Actian
      Einen Lead empfehlen Kunden schützen, Umsatz steigern
    • Symbol für die Suche nach einem Partner
      Einen Partner finden Nutzen Sie das Know-how und die Erkenntnisse unseres Partnernetzwerks
  • Lernen Lernen

    Lernen

    • Symbol für Bildeinzug links
      Blog
    • blaues Abschlusshut-Symbol
      Actian Academy
    • blaues Buch-Symbol
      Ressourcen
    • blaues Symbol mit Papier und Lupe für Actian
      Leitfäden
    • blaues Quadrat
      Webinare
    • blaues Listen-Logo
      Glossar
    • Podcast-Symbol
      Podcast
    Alle Ressourcen anzeigen
  • Unternehmen Unternehmen

    Unternehmen

    • blaues Actian Logo
      Über uns
    • blaues Ankündigungs-Symbol
      Newsroom
    • blaues Frage-Symbol
      Über HCLSoftware
    • blaues Aktenkoffer-Symbol für Actian
      Karriere
    • blaues Nutzer-Symbol Actian
      Leadership
    • blaues Häkchensymbol für Actian
      Auszeichnungen und Anerkennungen
    • blaues Kalender-Symbol
      Veranstaltungen
    • blaues Nachrichten-Symbol
      Kontakt
    Erfahren Sie mehr über Actian
Tour starten Demo anfordern Login
  • Support
  • Community
  • Downloads
  • Dokumentation
  • HCLSoftware
Lernen Sie unsere Datenlösungen kennen
Kontakt
Data Intelligence

Marquez: Die Metadaten bei WeWork

Actian Germany GmbH

10. Dezember 2020

Marquez v2 DE

Jüngste Blogbeiträge

Bleiben Sie auf dem Laufenden über neueste Datentrends

Abonnieren

WeWork wurde 2010 gegründet und ist ein weltweit tätiges Unternehmen, das Büros und Arbeitsräume vermietet. Ihr Ziel ist es, Teams jeder Größe - von Start-ups über KMU bis hin zu Großunternehmen - Raum für die Zusammenarbeit zu bieten. Um dies zu erreichen, kann das Angebot von WeWork in drei verschiedene Kategorien unterteilt werden:

  • Weltraum: Um den Unternehmen einen optimalen Raum zu bieten, muss WeWork die entsprechende Infrastruktur bereitstellen, d. h. Räume für Vorstellungsgespräche / Einzelgespräche oder sogar ganze Gebäude für große Unternehmen buchen. Sie müssen auch sicherstellen, dass sie mit den entsprechenden Einrichtungen wie Küchen für Mittagspausen und Kaffeepausen, Badezimmern usw. ausgestattet sind.
  • Gemeinschaft: Über die interne Anwendung von WeWork ermöglicht das Unternehmen den WeWork-Mitgliedern, miteinander in Kontakt zu treten, sei es lokal in ihrem eigenen WeWork-Raum oder weltweit. Wenn ein Unternehmen beispielsweise Feedback für ein Projekt von bestimmten Berufsgruppen benötigt (z. B. Entwickler oder UX-Designer), kann es über die Anwendung jedes Mitglied direkt um Feedback und Vorschläge bitten, unabhängig von dessen Standort.
  • Dienstleistungen: WeWork bietet seinen Mitgliedern auch einen umfassenden IT-Service bei Problemen sowie andere Dienstleistungen wie Lohnbuchhaltung, Versorgungsdienste usw.

Im Jahr 2020 steht WeWork für:

  • Mehr als 600.000 Mitgliedschaften.
  • Standorte in 127 Städten in 33 verschiedenen Ländern.
  • 850 Büros weltweit.
  • Erwirtschaftete 1,82 Milliarden Dollar an Einnahmen.

Es ist klar, dass WeWork mit allen Arten von Daten seiner Mitarbeiter und Kunden arbeitet, egal ob es sich dabei um Einzelpersonen oder Unternehmen handelt. Das große Unternehmen benötigte daher eine Plattform, auf der seine Datenexperten die Metadaten ihres Datenökosystems anzeigen, sammeln, aggregieren und visualisieren konnten. Diese Aufgabe wurde durch die Gründung von Marquez gelöst.

Dieser Artikel wird sich auf die Implementierung von Marquez durch WeWork konzentrieren, hauptsächlich durch die frei zugängliche Dokumentation, die auf verschiedenen Websites zur Verfügung gestellt wird, um die Bedeutung einer unternehmensweiten Metadaten zu veranschaulichen, um wirklich data driven zu werden.  

Warum Metadaten verwalten und nutzen?

In seinem Vortrag "A Metadaten Service for Data Abstraction, Data Lineage & Event-based Triggers" auf dem Data Council im Jahr 2018 erklärte Willy Lulciuc, Software Engineer für das Marquez-Projekt bei WeWork, dass Metadaten aus drei Gründen entscheidend ist:

  • Sicherstellung der Datenqualität: Wenn Daten keinen Kontext haben, ist es für die Bürger schwer, ihren Datenbeständen zu vertrauen: Fehlen Felder? Ist die Dokumentation auf dem neuesten Stand? Wer ist der Eigentümer der Daten und ist er es noch? Diese Fragen werden durch den Einsatz von Metadaten beantwortet.
  • Verstehen der Datenherkunft: Die Kenntnis der Datenherkunft und -umwandlung ist der Schlüssel, um wirklich zu wissen, welche Phasen Ihre Daten im Laufe der Zeit durchlaufen haben.
  • Demokratisierung von Datensätzen: Laut Willy Lulciuc ist die Demokratisierung von Daten im Unternehmen entscheidend! Die Bereitstellung eines zentralen Portals oder einer Benutzeroberfläche, über die Nutzer ihre Daten suchen und kennenlernen können, ist eine der wichtigsten Möglichkeiten für Unternehmen, eine echte Self-Service zu schaffen.

Zusammengefasst: Schaffung eines gesunden Datenökosystems. Willy erklärt, dass die Fähigkeit, Metadaten verwalten und zu nutzen, eine nachhaltige Datenkultur schafft, in der die Menschen nicht mehr um Hilfe bitten müssen, um die benötigten Daten zu finden und damit zu arbeiten. In seiner Folie geht er auf drei verschiedene Kategorien ein, die ein gesundes Daten-Ökosystem ausmachen:

  1. Ein Self-Service-Ökosystem zu sein, in dem Daten- und Geschäftsnutzer die Möglichkeit haben, die Daten und Metadaten zu entdecken, die sie benötigen, und die Datenbestände des Unternehmens kennenlernen , wenn sie nicht genau wissen, wonach sie suchen. Die Bereitstellung von Daten mit Kontext gibt allen Nutzern und Datenbürgern die Möglichkeit, effektiv an ihren Datenverwendungsfällen zu arbeiten.
  2. Selbstständigkeit, indem den Datennutzern die Freiheit gegeben wird, mit ihren Datensätzen zu experimentieren, und indem sie die Flexibilität haben, jeden Aspekt ihrer Datensätze zu bearbeiten, egal ob es sich beispielsweise um Eingabe- oder Ausgabedatensätze handelt.
  3. Und schließlich, anstatt sich auf bestimmte Personen oder Gruppen zu verlassen, ermöglicht ein gesundes Datenökosystem allen Mitarbeitern, für ihre eigenen Daten verantwortlich zu sein. Jeder Nutzer ist dafür verantwortlich, seine Daten und deren Kosten zu kennen (bringen diese Daten genug Wert?) und die Dokumentation seiner Daten im Auge zu behalten, um Vertrauen in seine Datensätze aufzubauen.

Zimmerbuchungs-Pipeline Vorher

Wie bereits erwähnt, ist die Verwendung von Metadaten von entscheidender Bedeutung für Datenbenutzer, um die von ihnen benötigten Daten zu finden. In seiner Präsentation teilte Willy eine reale Situation, um zu beweisen, dass Metadaten unerlässlich sind: Die Datenpipeline von WeWork für die Buchung eines Zimmers.

Für einen "WeWorker" sind die Schritte wie folgt:

  1. Finden Sie einen Standort (das Beispiel war ein Gebäudekomplex in San Francisco).
  2. Wählen Sie die geeignete Raumgröße (in der Regel nach der Anzahl der Teilnehmer aufgeteilt - in diesem Fall wurde ein Raum gewählt, der 1 - 4 Personen aufnehmen kann).
  3. Wählen Sie das Datum, an dem die Buchung stattfinden soll.
  4. Legen Sie das Zeitfenster fest, für das der Raum gebucht wird, sowie die Dauer der Sitzung.
  5. Bestätigen Sie die Buchung.

Nachdem wir nun ein Beispiel dafür haben, wie die Buchungspipeline funktioniert, demonstriert Willy, wie ein typisches Datenteam vorgehen würde, wenn es Daten über die Buchungen von WeWork auslesen wollte. In diesem Fall bestand die Beispielübung darin, das Gebäude mit den meisten Raumbuchungen zu finden und diese Daten zu extrahieren, um sie an das Management zu senden. Die Schritte, die er nannte, waren die folgenden:

  • Lesen Sie die Raumbuchungen aus einer (meist unbekannten) Datenquelle.
  • Fassen Sie alle Zimmerbuchungen zusammen und geben Sie die besten Standorte an.
  • Sobald die oberste Position berechnet ist, besteht der nächste Schritt darin, sie in eine Ausgabedatenquelle zu schreiben.
  • Führen Sie den Auftrag einmal pro Stunde aus.
  • Verarbeiten Sie die Daten über .csv-Dateien und speichern Sie sie irgendwo.

Willy erklärte jedoch, dass, auch wenn diese Schritte gut genug zu sein scheinen, in der Regel doch Probleme auftreten. Er geht auf drei Arten von Problemen während des Arbeitsprozesses ein:

  1. Wo finde ich den Datensatz des Job-Inputs?
  2. Hat der Datensatz einen Eigentümer? Wer ist es?
  3. Wie oft wird der Datensatz aktualisiert?

Die meisten dieser Fragen sind schwer zu beantworten, und die Aufträge scheitern am Ende. Wenn man sich nicht sicher ist und diesen Informationen nicht vertraut, kann es schwierig sein, dem Management Zahlen zu präsentieren. Diese Art von Problemen und Fragen waren es, die WeWork dazu veranlassten, Marquez zu entwickeln.

Was ist Marquez?

Willy definiert die Plattform als eine "Open-Source-Lösung für die Aggregation, Sammlung und Visualisierung von Metadaten des Datenökosystems von [WeWork]". In der Tat ist Marquez ein modulares System und wurde als hoch skalierbar, hochgradig erweiterbare, plattformunabhängige Lösung für das Metadaten konzipiert. Es besteht aus den folgenden Komponenten:

  • Metadaten Lager: Speichert alle Job- undMetadaten, einschließlich einer vollständigen Historie der Job-Läufe und Statistiken auf Job-Ebene (d.h. Gesamtläufe, durchschnittliche Laufzeiten, Erfolge/Misserfolge usw.).
  • Metadaten API: RESTful API, die es einer Vielzahl von Kunden ermöglicht, Metadaten rund um die Datensatz und -nutzung zu sammeln.
  • Metadaten UI: Dient derEntdeckung von Datensatz , der Verbindung mehrerer Datensätze und der Erkundung ihres Abhängigkeitsgraphen.

Marquez's Entwurf

Marquez bietet sprachspezifische Clients, die die Metadaten implementieren. Dies ermöglicht es einer Vielzahl von Datenverarbeitungsanwendungen, eine Metadaten aufzubauen. In der ersten Version wurden sowohl Java als auch Python unterstützt.

Die Metadaten extrahiert Informationen über die Produktion und den Verbrauch von Datensätzen. Es handelt sich um eine zustandslose Schicht, die für die Spezifikation der Persistenz und Aggregation von Metadaten verantwortlich ist. Die API ermöglicht es den Clients, Datensatz zu sammeln und/oder aus demLager zu beziehen.

Metadaten müssen so gesammelt, organisiert und gespeichert werden, dass sie über die Metadaten UI abgefragt werden können. DasLager dient als Katalog von Datensatz , die von der Metadaten gekapselt und sauber abstrahiert werden.

Laut Willy macht ein starkes Daten-Ökosystem die Fähigkeit aus, nach Informationen und Datensätzen zu suchen. Die Datensätze in Marquez werden durch die Verwendung eines suchmaschinenbasierten Schlüsselworts oder einer Phrase sowie der Dokumentation eines Datensatz indiziert und eingestuft: Je mehr Kontext ein Datensatz hat, desto wahrscheinlicher ist es, dass er in den Suchergebnissen an erster Stelle erscheint. Beispiele für die Dokumentation eines Datensatzsind seine Beschreibung, sein Eigentümer, sein Schema, sein Tag, usw.

Weitere Einzelheiten zu Marquez' Datenmodell können Sie in der Präsentation selbst sehen: https://www.youtube.com/watch?v=dRaRKob-lRQ&ab_channel=DataCouncil

Die Zukunft des Datenmanagement bei WeWork

Zwei Jahre nach dem Projekt hat sich Marquez als große Hilfe für die riesige Leasingfirma erwiesen. Die langfristige Roadmap des Unternehmens sieht vor, sich ausschließlich auf die Benutzeroberfläche der Lösung zu konzentrieren und mehr Visualisierungen und grafische Darstellungen einzubeziehen, um den Benutzern einfachere und unterhaltsamere Möglichkeiten zur Interaktion mit ihren Daten zu bieten.

Sie bieten auch verschiedene Online-Communities über ihre Github-Seite sowie Gruppen auf LinkedIn für diejenigen, die sich für Marquez interessieren, um Fragen zu stellen, Ratschläge zu erhalten oder sogar Probleme mit der aktuellen Marquez-Version zu melden.

Quellen

Ein Metadaten für Datenabstraktion, Data Lineage & ereignisbasierte Auslöser, WeWork. Youtube: https://www.youtube.com/watch?v=dRaRKob-lRQ&ab_channel=DataCouncil

29 verblüffende WeWork-Statistiken - Die neue Ära des Coworking, TechJury.com: https://techjury.net/blog/wework-statistics/

Marquez: Sammeln, aggregieren und visualisieren Sie die Metadaten eines Datenökosystems, https://marquezproject.github.io/marquez/

Marquez: Ein quelloffener Metadaten für ML-Plattformen Willy Lulciuc
actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, verwalten und Analyse von Daten in Cloud, Hybrid- und On-Premises . Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und Analytik liefert Actian High-Performance Lösungen, die Unternehmen in die Lage versetzen, data driven Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und hat Branchenauszeichnungen für Leistung und Innovation erhalten. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im Actian-Blog behandeln wir Themen, die von Dateneingang bis hin zu KI-gesteuerter Analytik reichen. Lernen Sie das Führungsteam kennen https://www.actian.com/company/leadership-team/
  • Metadaten Management
  • Teilen mitTwitter-Symbol
  • Teilen mitLinkedin-Symbol
  • Teilen mitFacebook-Symbol
  • Teilen mitMail-Symbol

Abonnieren Sie den Actian Blog

Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.

  • Bleiben Sie auf dem Laufenden: Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
  • Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
  • Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.

Abonnieren

Diese E-Mail-Erweiterung () ist nicht erlaubt. Bitte aktualisieren.
Eine E-Mail-Adresse unter dieser privaten Domain () ist nicht erlaubt. Bitte aktualisieren.

Danke, dass Sie den Actian Blog abonniert haben!

Informieren Sie sich und lassen Sie sich inspirieren von den neuesten Erkenntnissen, Trends und Updates aus der Welt der Data Analytics und IT.

In Kürze finden Sie unsere sorgfältig zusammengestellten Artikel, Case Studys und Branchen-News in Ihrem Posteingang.

Auch von Interesse:
  • Datenintelligenz für klügere Entscheidungen
  • Ist Ihr Unternehmen bereit für GenAI?
  • Flexible Datenintegration

Daten + KI-Intelligenz

  • Actian Data Intelligence Platform
  • Actian Data Observability
  • Actian Data Platform

Funktionen

  • Data Analytics
  • Datenbanken
  • Datenintegration und -qualität
  • Anwendungsdienste

Lösungen

  • Fertigung
  • Finanzdienstleistungen
  • Data Analytics im Gesundheitswesen
  • Transport und Logistik
  • Kommunikation

Unternehmen

  • Über HCLSoftware
  • Veranstaltungen
  • Auszeichnungen und Anerkennungen
  • Newsroom
  • Presse
  • Karriere
  • Standorte

Kunden

  • Support
  • Community
  • Dokumentation
  • Anmeldung zum Kundenportal
  • Actian Data Platform Login

Auf geht's

  • Demo anfordern
  • Kontakt
Actian
© 2025 Actian Germany GmbH. Alle Rechte vorbehalten.
  • LinkedIn
  • GitHub
  • YouTube
  • Nutzungsbedingungen
  • Lieferkettengesetz
  • Datenschutzbestimmungen
  • Richtlinien für Markenzeichen
  • Patente
  • Sicherheit
HCL-Logo