Zum Inhalt springen
  • HCLSoftware
  • Support
  • Community
  • Downloads
  • Dokumentation
  • Anmeldung
Ein Grafik-Logo der Firma Actian Ein Grafik-Logo der Firma Actian
  • Produkte Produkte
    • blaues Daten-Symbol für Actian

      Daten + KI Intelligenz

      Actian Daten-Intelligenz-Plattform Neu
      Cloud-native SaaS-Lösung, die den Datenzugang demokratisiert und datengetriebene Initiativen beschleunigt
      Actian Data Beobachtbarkeit Neu
      KI-basierte Beobachtbarkeit für offene Architekturen
      Actian Data Platform
      Einfaches Verbinden, Verwalten und Analysieren von Daten über eine einheitliche Plattform
    • blaues Datenbank-Symbol für Actian

      Datenbanken

      • Zen
        Pflegeleichte eingebettete Datenbank
      • Actian NoSQL
        Datenbanken für komplexe Objektnetzwerke
      • Actian Ingres
        Skalierbare und zuverlässige Transaktionsverarbeitung
      • HCL Informix®
        Schnelle, kostensparende Verwaltung von Unternehmensdaten
    • blaues Liniendiagramm-Symbol für Actian

      Analytik

      • Vektor
        Leistungsstarke, vektorisierte spaltenbasierte Analytics-Datenbank
    • Integrationen

      Datenmanagement

      • DataConnect
        Hochgradig skalierbare hybride Integrationslösung
      • Datenqualität
        Treffen Sie fundierte Entscheidungen, die Ihr Unternehmen voranbringen
      • DataFlow
        Parallele Ausführungsplattform Data-in-Motion
    • blaues Balkendiagramm-Symbol

      App-Modernisierung

      • OpenROAD
        Datenbank, objektorientierte schnelle Anwendungsentwicklung
      • VoltMX
        Entwicklungsplattform für Anwendungen mit geringem Code
    • Alle Actian Produkte anzeigen
    • blaues Quadrat mit Rechtspfeil nach oben

      Deployment

      Deployment

      In der Cloud, hybrid und On-Premises

      • Google Cloud Starten Sie Ihre Migration zu Google mit Actian
      • Amazon Web Services Starten Sie Ihre Migration zu AWS mit Actian
      • Microsoft Azure Starten Sie Ihre Migration zu Azure mit Actian
    Alle Actian Produkte anzeigen Alle Deployment-Partner kennenlernen
  • Lösungen Lösungen

    Lösungen nach Branche

    • Fertigung
    • Transport und Logistik
    • Bankwesen, Finanzdienstleistungen und Versicherungen
    • Gesundheitswesen und Biowissenschaften
    • Einzelhandel und Konsumgüter
    • Energie und Versorgungsunternehmen

    Use Cases

    • GenAI-Symbol
      GenAI Data Readiness Eine kurze Checkliste zur Bewertung Ihrer GenAI-Bereitschaft
    • blaues Ebenensymbol für Actian
      Flexible Datenintegration Sammeln, Umwandeln und Automatisieren von Datenpipelines
    • Datenbank blaues Symbol
      Daten-Warehouse-Modernisierung Risikoarme, vereinfachte Migration zu einem modernen Data Warehouse, bereitgestellt On-Premises und in verschiedenen Clouds
    • Symbol für blaue Kommunikationslösungen
      Marktplatz für Unternehmensdaten Datenprodukte entdecken, abrufen und gemeinsam nutzen
    • blaues Wolkensymbol für Actian
      Edge-to-Cloud-Analytik Modernisieren Sie die Verarbeitung und Analyse von Anwendungsdaten am Edge
    • blaues Datenflussdiagramm-Symbol für Actian
      Kundendaten-Analyse-Hub Erhalten Sie umsetzbare Customer Intelligence in Echtzeit über all Ihre CX-Datensilos
    Alle Branchenlösungen kennenlernen
  • Kunden Kunden

    Kunden

    • blaues Benutzersymbol für Actian
      Unsere Kunden Werden Sie Teil einer wachsenden Gemeinschaft von Unternehmen aus verschiedenen Branchen, die Actian vertrauen, um das Potenzial ihrer Daten zu erschließen

    Ausgewählte Customer Storys

    • blaues Nutzer-Symbol für Actian
      Academy Bank
    • blaues Nutzer-Symbol für Actian
      Tsubakimoto
    Alle Kunden anzeigen
  • Partner Partner

    Partner

    • blaues Info-Quadrat-Symbol für Actian
      Programm-Übersicht Wettbewerbsfähige Lösungen, branchenführende Anreize und ein umfassendes Support-Paket
    • blaues Häkchensymbol für Actian
      Werden Sie Partner Forcieren Sie Ihr Geschäft mit dem Actian Partner-Programm
    • blaues Bezier-Symbol für Actian
      Technologie-Partner Partnerschaften mit Multiplikatoreffekt
    • blaues Nutzer-Symbol für Actian
      Einen Lead empfehlen Kunden schützen, Umsatz steigern
    • Symbol für die Suche nach einem Partner
      Einen Partner finden Nutzen Sie das Know-how und die Erkenntnisse unseres Partnernetzwerks
  • Lernen Lernen

    Lernen

    • Symbol für Bildeinzug links
      Blog
    • blaues Abschlusshut-Symbol
      Actian Academy
    • blaues Buch-Symbol
      Ressourcen
    • blaues Symbol mit Papier und Lupe für Actian
      Leitfäden
    • blaues Quadrat
      Webinare
    • blaues Listen-Logo
      Glossar
    Alle Ressourcen anzeigen
  • Unternehmen Unternehmen

    Unternehmen

    • blaues Actian Logo
      Über uns
    • blaues Ankündigungs-Symbol
      Newsroom
    • blaues Frage-Symbol
      Über HCLSoftware
    • blaues Aktenkoffer-Symbol für Actian
      Karriere
    • blaues Nutzer-Symbol Actian
      Leadership
    • blaues Häkchensymbol für Actian
      Auszeichnungen und Anerkennungen
    • blaues Kalender-Symbol
      Veranstaltungen
    • blaues Nachrichten-Symbol
      Kontakt
    Erfahren Sie mehr über Actian
Tour starten Demo anfordern Anmeldung
  • Support
  • Community
  • Downloads
  • Dokumentation
  • HCLSoftware
Erfahren Sie mehr über unsere Datenlösungen
Kontakt
Daten-Intelligenz

WhereHows: Ein Daten-Discovery und Lineage-Portal für LinkedIn

Actian Germany GmbH

April 20, 2020

linkedin-wo zeigt

Letzte Blogbeiträge

Bleiben Sie auf dem Laufenden über die neuesten Datentrends

Abonnieren

Metadaten werden für moderne data driven Unternehmen immer wichtiger. In einer Welt, in der die Datenlandschaft in rasantem Tempo wächst und die Informationssysteme immer komplexer werden, haben Organisationen in allen Bereichen verstanden, wie wichtig es ist in der Lage zu sein, ihre Datenbestände zu entdecken, zu verstehen und ihnen zu vertrauen.

Ganz gleich, ob Ihr Unternehmen in der Streaming wie Spotify oder Netflix, in der Ride-Sharing-Branche wie Uber oder Lyft oder sogar im Vermietungsgeschäft wie Airbnb tätig ist, es ist für Datenteams unerlässlich mit den richtigen Tools und Lösungen ausgestattet sind, die es ihnen ermöglichen, innovativ zu sein und mit ihren Daten Mehrwert zu schaffen.

In diesem Artikel konzentrieren wir uns auf WhereHows, ein Open-Source-Projekt unter der Leitung des LinkedIn-Datenteams, das ein zentrales Lager und Portal für Menschen, Prozesse und Wissen rund um Daten schafft. Mit mehr als 50 Tausend Datensätzen, 14 Tausend Kommentaren und 35 Millionen Jobausführungen und den damit verbundenen Informationen über den Werdegang, ist klar, dass das Daten-Discovery von LinkedIn ein Erfolg ist.

LinkedIn Schlüsselstatistiken

Das Unternehmen wurde 2003 von Reid Hoffman, Allen Blue, Konstantin Guericke, Eric Ly und Jean-Luc Vaillant in Kalifornien gegründet und begann sehr langsam. Im Jahr 2007 wurde es schließlich profitabel und hatte 2011 mehr als 100 Millionen Mitglieder weltweit.

Ab 2020 ist LinkedIn deutlich gewachsen:

  • Mehr als 660 Millionen LinkedIn-Mitglieder weltweit, davon 206 Millionen aktive Nutzer in Europa.
  • Mehr als 80 Millionen Nutzer auf LinkedIn Slideshare.
  • Mehr als 9 Milliarden Inhaltsabrufe.
  • 30 Millionen Unternehmen sind weltweit registriert.

LinkedIn ist definitiv eine unverzichtbare professionelle Social-Networking-Anwendung für Personalvermittler, Marketingexperten und sogar Vertriebsprofis. Wie kann der Web-Gigant mit all diesen Daten Schritt halten?

Wie alles anfing

Wie die meisten Unternehmen mit einem ausgereiften BI-Ökosystem verfügte LinkedIn zunächst über ein Data-Warehouse-Team, das für die Integration verschiedener Informationsquellen in konsolidierte goldene Datensätze zuständig war. Als die Anzahl der Datensätze, Produzenten und Konsumenten wuchs, fühlte sich das Team zunehmend von der kolossalen Datenmenge, die jeden Tag generiert wurde, überfordert. Einige der Fragen, die sich stellten, waren:

  • Wer ist der Eigentümer dieses Datenflusses?
  • Wie sind diese Daten zustande gekommen?
  • Wo sind die Daten?
  • Welche Daten werden verwendet?

Als Reaktion darauf hat LinkedIn beschlossen, ein zentralesLager um ihre Metadaten über alle Systeme hinweg zu erfassen und sie über eine einzigartige Plattform zur Vereinfachung der Daten-Discovery zu veröffentlichen: WhereHows.

Was ist WhereHows?

WhereHows integriert sich in alle Datenverarbeitungsumgebungen und extrahiert Metadaten aus ihnen.

Anschließend werden diese Informationen über zwei verschiedene Schnittstellen angezeigt:

  1. Eine Webanwendung, die Folgendes ermöglicht Navigation, Suche, Visualisierung der Abstammung, Diskussionen und Zusammenarbeit.
  2. Ein API-Endpunkt, der die Automatisierung von anderen Datenprozessen und Anwendungen ermöglicht.

Mit diesem Lager kann LinkedIn Probleme im Zusammenhang mit Datenabstammung, Dateneigentum, Schemaerkennung, operativem Metadaten , Datenprofilierung und Cluster Vergleich lösen. Darüber hinaus implementierten sie maschinenbasierte Mustererkennung und Assoziation zwischen dem Geschäftsglossar und ihren Datensätzenund schufen eine auf Beteiligung und Zusammenarbeit basierende Community, die es ihnen ermöglicht, die Metadaten zu pflegen, indem sie Gespräche und Stolz auf das Eigentum fördern.

Es gibt drei Hauptkomponenten von WhereHows:

  1. Ein Lager , das alle Metadaten speichert.
  2. Ein Webserver, der Daten über API und UI bereitstellt.
  3. Ein Backend-Server, der Metadaten aus anderen Informationsquellen abruft.

Wie funktioniert WhereHows?

Die Stärke von WhereHows liegt in den Metadaten , die es aus dem Daten-Ökosystem von Linkedin sammelt. Es sammelt die folgenden Metadaten:

  • Operative Metadaten, wie z.B. Aufträge, Flüsse, etc.
  • Abstammungsinformationen, die die Datensätze der Stellen miteinander verbinden.
  • Die katalogisierten Informationen wie der Speicherort des Datensatz, seine Schemastruktur, der Eigentümer, das Erstellungsdatum und so weiter.

Wie sie Metadaten verwenden

WhereHows verwendet ein universelles Modell, das es den Datenteams ermöglicht, den Wert der Metadaten besser zu nutzen, z. B. durch eine plattformübergreifende Suche nach unterschiedlichen Aspekten von Datensätzen.

Auch die Metadaten in einem Datensatz und die operativen Metadaten eines Auftrags sind zwei Endpunkte. Die Lineage-Informationen verbinden sie miteinander und ermöglichen es Datenteams, von einem Datensatz/Job zu seinen vor- und nachgelagerten Jobs/Datensätzen zurückzuverfolgen. Wenn das gesamte Datenökosystem in WhereHows gesammelt wird, können sie den Datenfluss von Anfang bis Ende verfolgen.

Wie sie Metadaten sammeln

Die zum Sammeln von Metadaten verwendete Methode hängt von der Quelle ab. Für Hadoop-Datensätze gibt es beispielsweise Scraper-Jobs, die HDFS-Ordner und -Dateien durchsuchen, die Metadaten lesen und sie dann wieder speichern.

Bei Schedulern wie Azkaban wird eine Verbindung zu ihrem Lager hergestellt, um die Metadaten zu erhalten, sie zu aggregieren und in das benötigte Format umzuwandeln und sie dann in WhereHows zu laden. Für die Lineage-Informationen analysieren sie das Protokoll eines MapReduce und das Ausführungsprotokoll eines Schedulers und kombinieren dann diese Informationen, um die Lineage zu erhalten.

Wie geht es weiter mit WhereHows?

Heute wird WhereHows bei LinkedIn nicht nur alsLager aktiv genutzt, sondern auch zur Automatisierung anderer Datenprojekte, wie z. B. der automatisierten Datenbereinigung für die Compliance. Im Jahr 2016 wurden die unten aufgeführten Systeme integriert:

Für die Zukunft hoffen die Datenteams von LinkedIn, die Abdeckung ihrer Metadaten durch die Integration weiterer Systeme wie Kafka oder Samza zu erweitern. Sie planen auch die Integration von Systemen für das Datenlebenszyklusmanagement und die Bereitstellung von Daten wie Nuage oder Goblin, um die Metadaten zu erweitern. WhereHows hat sein letztes Wort noch nicht gesprochen.

Quellen:

  • 50 der wichtigsten LinkedIn-Statistiken für 2020
  • Open Sourcing WhereHows: Ein Daten-Discovery und Abstammungsportal
actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, Verwaltung und Analyse von Daten in Cloud-, Hybrid- und lokalen Umgebungen. Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und -analyse liefert Actian leistungsstarke Lösungen, die es Unternehmen ermöglichen, datengesteuerte Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und wurde für seine Leistung und Innovation mit Branchenpreisen ausgezeichnet. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im ActianBlog behandeln wir Themen wie Echtzeit-Dateneingabe, Datenanalyse, Data Governance, Datenmanagement, Datenqualität, Datenintelligenz und KI-gesteuerte Analysen.
  • Metadaten Management
  • Teilen mitTwitter-Symbol
  • Teilen mitLinkedin-Symbol
  • Teilen mitFacebook-Symbol
  • Teilen mitMail-Symbol

Abonnieren Sie den Actian Blog

Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.

  • Bleiben Sie auf dem Laufenden - Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
  • Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
  • Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.

Abonnieren

Diese E-Mail-Erweiterung () ist nicht erlaubt. Bitte aktualisieren.
Eine E-Mail-Adresse unter dieser privaten Domain () ist nicht erlaubt. Bitte aktualisieren.

Danke, dass Sie den Actian Blog abonniert haben!

Informieren Sie sich und lassen Sie sich inspirieren von den neuesten Erkenntnissen, Trends und Updates aus der Welt der Data Analytics und Technologie.

Erwarten Sie, dass unsere sorgfältig zusammengestellten Artikel, Fallstudien und Branchennachrichten bald in Ihrem Posteingang landen.

Auch von Interesse:
  • Datenintelligenz für klügere Entscheidungen
  • Zur 360-Grad-Kundensicht
  • Actian zum Top-Anbieter für Datenqualität ernannt

Plattformen

  • Actian Daten-Intelligenz-Plattform
  • Actian Data Platform

Funktionen

  • Data Analytics
  • Datenbanken
  • Datenintegration und -qualität
  • Anwendungsdienste

Lösungen

  • Fertigung
  • Finanzdienstleistungen
  • Data Analytics im Gesundheitswesen
  • Transport und Logistik
  • Kommunikation

Unternehmen

  • Über Actian
  • Über HCLSoftware
  • Veranstaltungen
  • Auszeichnungen und Anerkennungen
  • Newsroom
  • Presse
  • Karriere
  • Standorte

Kunden

  • Support
  • Community
  • Dokumentation
  • Anmeldung zum Kundenportal
  • Actian Data Platform Anmeldung

Auf geht's

  • Demo anfordern
  • Kontakt
Actian
© 2025 Actian Germany GmbH. Alle Rechte vorbehalten.
  • x Social Media-Symbol
  • Facebook
  • LinkedIn
  • GitHub
  • YouTube
  • Nutzungsbedingungen
  • Lieferkettengesetz
  • Datenschutzbestimmungen
  • Richtlinien für Markenzeichen
  • Patente
  • Sicherheit
HCL-Logo