Blog | Data Analytics | | 7 Min. Lesezeit

Affinitätsanalyse mit Actian Data Platform

Affinitätsanalytik

Bei der Affinitätsanalyse geht es darum, Beziehungen und Muster in Daten zu finden. Unternehmen können die Ergebnisse der Affinitätsanalyse für viele positive Auswirkungen nutzen. Hier sind nur zwei Beispiele aus echten Kundenanwendungen. Erstens möchte das Management im Einzelhandel wissen, welche Produkte sich typischerweise gut zusammen verkaufen, um sie zu platzieren und zu bewerben. Diese Informationen sind entscheidend für ein erfolgreiches Upselling zusätzlicher Produkte. Ein weiteres Beispiel: Telekommunikationsanbieter müssen Daten über den Netzverkehr untersuchen, um Routing-Muster zu verstehen und Ausrüstung und Topografie zu optimieren. Wie in diesen Anwendungsfällen gibt es auch in Ihrem Unternehmen wahrscheinlich Datenaffinitäten, die Sie nutzen können, um bessere Geschäftsentscheidungen zu treffen. Actian bietet die Data-Warehouse-Plattform, die Sie dabei unterstützt.

Obwohl die Affinität eindeutig nützlich ist, ist sie in herkömmlichen Data Warehouses nur schwer zu finden, weil dazu eine der schwierigsten und ressourcenintensivsten SQL-Anweisungen ausgeführt werden muss, nämlich der Self-Join von Faktentabellen (auch als "Warenkorb" abfragen bekannt). Diese abfragen ist schwierig, weil Data-Warehouse-Faktentabellen oft Milliarden von Zeilen enthalten (wie meine hier), und das Verbinden von Milliarden von Zeilen mit sich selbst, um eine Affinität zu finden, erfordert eine Menge Rechenleistung. Einige Plattformen können das gar nicht, oder es dauert so lange, dass es unbrauchbar ist. Hier zeigt sich die Stärke des Actian Data Warehouse.

In diesem Blog erkläre ich, wie man erfolgreich Affinitätsanalysen durchführen kann, indem man ausschließlich die integrierten Funktionen des Actian Data Warehouse nutzt, ohne dass weitere Tools erforderlich sind!

Actian bietet branchenführende Cloud , die speziell für hohe Leistung entwickelt wurden. Was ich hier zeigen werde, ist, dass Actian - von Haus aus - die notwendigen Werkzeuge für SQL-Analysen bereitstellt, so dass Sie Dinge wie Affinitätsanalysen durchführen können, ohne sich auf riesige, teure Projekte mit zusätzlichen Werkzeugen von Drittanbietern einlassen zu müssen.

Hier ist mein Szenario:

Ich habe ein Data Warehouse für den Einzelhandel. Die Marketingabteilung möchte eine Postwurfsendung planen, um den Verkauf von Produkten zu fördern, die in der Regel gut zusammen mit den meistverkauften Produkten des Geschäfts verkauft werden. Insbesondere sollen Coupons an Kunden verschickt werden, die NICHT die Produkte gekauft haben, die normalerweise zusammen gekauft werden, aber mindestens eines der meistverkauften Produkte gekauft HABEN. Das Unternehmen möchte, dass ich Daten zur Unterstützung dieser Kampagne liefere.

Mein Analyseprozess wird folgendermaßen aussehen:

  1. Untersuchen Sie die Daten.
  2. Finden Sie die meistverkauften Produkte (A).
  3. Finden Sie Produkte, die häufig mit Top-Produkten verkauft werden (B).
  4. Ermitteln Sie die Kundenpopulation, die A, aber nicht B gekauft haben.
  5. Stellen Sie dem Marketing geeignete Informationen zur Verfügung.

Für diesen Blog habe ich ein 8 AU (Actian Unit) Warehouse in der Google Cloud Platform erstellt. Eine Actian Unit ist ein Maß für die Cloud , das nach oben oder unten skaliert werden kann.

Meine ActianDatenbank hat ein typisches Einzelhandelsschema, aber für diesen Blog werde ich mich nur auf vier Tabellen konzentrieren. Siehe Abbildung 2.

Abbildung 2: Einzelhandels-ER-Diagramm
Abbildung 2: Einzelhandels-ER-Diagramm

Ich habe einen Datengenerator verwendet, um eine große Menge an Daten zu erzeugen, aber ich habe einige künstlich überlagerte Muster hinzugefügt, um diesen Blog interessanter zu machen. Meine Tabellen haben die folgende Anzahl von Zeilen:

Kunde 5,182,631
Bestellung 1,421,706,929
Einzelposten 45,622,951,425
Produkt 16,424

 

Ich kann nun die Tools in der ActianKonsole Query Editor verwenden, um meinen Analyseprozess auszuführen. Sie finden den Abfrage-Editor in der oberen rechten Ecke der Warehouse-Definitionsseite. Ich habe ihn in Abbildung 1 blau eingekreist.

Für alle Abfragen in diesem Blog habe ich die folgende Reihenfolge eingehalten: Ich habe meine abfragen in das abfragen eingegeben (1), die abfragen (optional) formatiert (2), dann die abfragen ausgeführt (3) und anschließend die abfragen zur späteren Verwendung gespeichert (4). Siehe das Sequenzlayout in Abbildung 3. Beachten Sie, dass Sie auch das Layout meines gesamten Schemas (roter Kreis) im Abfrage-Editor sehen können.

Abbildung 3: Layout des Anfrage
Abbildung 3: Layout des Anfrage

Untersuchen Sie die Daten

Zunächst möchte ich meine Daten verstehen, indem ich ein paar interessante Abfragen ausführe.

Ich möchte verstehen, welche Monate an Daten in meinem ActianWarehouse vorhanden sind und einige Gesamtzahlen verstehen. (Anmerkung: Dieser Blog wurde Anfang 2021 verfasst). Ich führe diese Abfrage aus:

Abbildung 4: Einzelpostenstatistik
Abbildung 4: Einzelpostenstatistik

Dank der Schnelligkeit von Actian konnte ich in nur wenigen Sekunden einige wertvolle Informationen aus meinem Lager abrufen. Es sieht so aus, als hätte ich Daten aus fünf Jahren mit über 45 Milliarden verkauften Artikeln und einem durchschnittlichen Umsatz von 625 Dollar. Das ist fantastisch! Siehe Abbildung 4.

Außerdem würde ich gerne die Entwicklung der Verkäufe nach Monaten sehen. Ich führe diese abfragen durch:

Abbildung 5: Entwicklung der Verkäufe
Abbildung 5: Entwicklung der Verkäufe

Auch diese abfragen war in wenigen Sekunden erledigt, aber bei all diesen großen Zahlen ist es etwas schwierig, die relativen Werte zu erfassen. Es wird hilfreich sein, ein Diagramm mit der Diagrammfunktion des Actian Query Editors zu erstellen.

Ich habe die Diagrammfunktion (siehe Abbildung 6) verwendet, um ein Balkendiagramm zu erstellen. Ich führe im Wesentlichen dieselbe abfragen durch, habe sie aber vereinfacht und die Ausgabe auf das letzte Jahr beschränkt. Es ist nun leicht zu erkennen, dass meine Verkäufe um Weihnachten herum wirklich zugenommen haben. In Abbildung 7 habe ich gezeigt, wie ich dieses Diagramm konfiguriert habe.

Abbildung 6: Entwicklung des Umsatzes mit Diagramm
Abbildung 6: Entwicklung des Umsatzes mit Diagramm
Abbildung 7: Konfiguration des Diagramms
Abbildung 7: Konfiguration des Diagramms

Meistverkaufte Produkte finden (A)

Da ich nun meine Daten kenne, führe ich diese abfragen durch, um die umsatzstärksten Produktkategorien nach Ausgaben im letzten Jahr zu finden:

Abbildung 8: Wichtigste Kategorien nach Ausgaben
Abbildung 8: Wichtigste Kategorien nach Ausgaben

In nur wenigen Sekunden erfahre ich, dass Kleidung und Elektronik meine meistverkauften Produktkategorien insgesamt waren. Ich weiß, dass das Marketing immer gerne mit Elektronik arbeitet, also werde ich mich darauf konzentrieren.

Als nächstes möchte ich die meistverkauften Produkte im Bereich Elektronik im letzten Jahr finden. Ich führe diese abfragen durch:

Abbildung 9: Spitzenprodukte im Bereich Elektronik
Abbildung 9: Spitzenprodukte im Bereich Elektronik

Dank der Geschwindigkeit von Actian erfahre ich in wenigen Sekunden, dass viele der Top-Produkte in meiner Kategorie Elektronik von Canon stammen. Siehe Abbildung 9.

Produkte finden, die häufig mit Top-Produkten verkauft werden (B)

Nun möchte ich die Elektronikprodukte finden, die in den letzten sechs Monaten am häufigsten zusammen mit diesen meistverkauften Canon Produkten verkauft wurden. Dies ist die ressourcenintensive abfragen , die ich in meiner Einleitung erwähnte. Bei der Ausführung dieser abfragen werden meine 45 Milliarden Einzelposten mit denselben 45 Milliarden Einzelposten verbunden, um zu sehen, welche Artikel typischerweise zusammen gekauft werden. Ich führe diese abfragen aus:

Abbildung 10: Warenkorb abfragen
Abbildung 10: Warenkorb abfragen

Diese abfragen ist viel komplexer als die vorherigen Abfragen, dennoch dauerte die Ausführung in Actian nur 17 Sekunden. Aus dieser abfragen ist ersichtlich, dass Canon-Kunden häufig SDHC-Speicherkarten verschiedener Typen kaufen. Das erscheint natürlich logisch, aber ich habe das jetzt mit Analytics nachgewiesen.

Finden Sie die Kundenpopulation, die A, aber nicht B gekauft hat

Jetzt muss ich die Namen und Adressen der Kunden finden, die KEINE Speicherkarten gekauft haben. Dies ist im Grunde eine umgekehrte abfragen. Actian verknüpft die 45 Milliarden Zeilen umfassende Tabelle der Einzelposten wieder mit sich selbst, um diesmal fehlende Beziehungen zu finden - Kunden, die keine Speicherkarten gekauft haben. Anschließend müssen die Positions- und Bestellinformationen wieder mit der Kundentabelle verknüpft werden, um die entsprechenden Namens- und Adressinformationen zu erhalten. Außerdem muss ich sicherstellen, dass ich keine doppelten Mailings an Kunden sende, die möglicherweise mehrere Canon-Produkte gekauft haben, also habe ich das Schlüsselwort DISTINCT zu meiner SQL hinzugefügt. Ich führe die unten stehende abfragen aus. Sobald sie beendet ist, wähle ich die Option .csv-Download, um eine Ausgabedatei zu erstellen. Siehe die roten Kreise in Abbildung 11.

Abbildung 11: Umgekehrter Marktkorb.  Keine Affinität.
Abbildung 11: Umgekehrter Marktkorb. Keine Affinität.

Geeignete Informationen für das Marketing bereitstellen

Jetzt kann ich die .csv-Datei mit den potenziellen Kunden ganz einfach per E-Mail an den Vertrieb senden, damit dieser seine Marketing-Kampagne verschicken kann.

Abbildung 12: E-Mail mit Zielliste
Abbildung 12: E-Mail mit Zielliste

Zusammenfassend lässt sich sagen, dass das Actian Data Warehouse eine sehr leistungsfähige Cloud ist, die auch die grundlegenden Werkzeuge und die Geschwindigkeit enthält, die Sie benötigen, um mit Affinity Analytics in Ihrem Unternehmen produktiv zu sein.