Affinitätsanalyse mit Actian Data Platform
Maria Schulte
Oktober 29, 2021

Bei der Affinitätsanalyse geht es darum, Beziehungen und Muster in Daten zu finden. Unternehmen können die Ergebnisse der Affinitätsanalyse für viele positive Auswirkungen nutzen. Hier sind nur zwei Beispiele aus echten Kundenanwendungen. Erstens möchte das Management im Einzelhandel wissen, welche Produkte sich typischerweise gut zusammen verkaufen, um sie zu platzieren und zu bewerben. Diese Informationen sind entscheidend für ein erfolgreiches Upselling zusätzlicher Produkte. Ein weiteres Beispiel: Telekommunikationsanbieter müssen Daten über den Netzverkehr untersuchen, um Routing-Muster zu verstehen und Ausrüstung und Topografie zu optimieren. Wie in diesen Anwendungsfällen gibt es auch in Ihrem Unternehmen wahrscheinlich Datenaffinitäten, die Sie nutzen können, um bessere Geschäftsentscheidungen zu treffen. Actian bietet die Data-Warehouse-Plattform, die Sie dabei unterstützt.
Obwohl die Affinität eindeutig nützlich ist, ist sie in herkömmlichen Data Warehouses nur schwer zu finden, weil dazu eine der schwierigsten und ressourcenintensivsten SQL-Anweisungen ausgeführt werden muss, nämlich der Self-Join von Faktentabellen (auch als "Warenkorb" Anfrage bekannt). Diese Anfrage ist schwierig, weil Data-Warehouse-Faktentabellen oft Milliarden von Zeilen enthalten (wie meine hier), und das Verbinden von Milliarden von Zeilen mit sich selbst, um eine Affinität zu finden, erfordert eine Menge Rechenleistung. Einige Plattformen können das gar nicht, oder es dauert so lange, dass es unbrauchbar ist. Hier zeigt sich die Stärke des Actian Data Warehouse.
In diesem Blog erkläre ich, wie man erfolgreich Affinitätsanalysen durchführen kann, indem man ausschließlich die integrierten Funktionen des Actian Data Warehouse nutzt, ohne dass weitere Tools erforderlich sind!
Actian bietet branchenführende Cloud , die speziell für hohe Leistung entwickelt wurden. Was ich hier zeigen werde, ist, dass Actian - von Haus aus - die notwendigen Werkzeuge für SQL-Analysen bereitstellt, so dass Sie Dinge wie Affinitätsanalysen durchführen können, ohne sich auf riesige, teure Projekte mit zusätzlichen Werkzeugen von Drittanbietern einlassen zu müssen.
Hier ist mein Szenario:
Ich habe ein Data Warehouse für den Einzelhandel. Die Marketingabteilung möchte eine Postwurfsendung planen, um den Verkauf von Produkten zu fördern, die in der Regel gut zusammen mit den meistverkauften Produkten des Geschäfts verkauft werden. Insbesondere sollen Coupons an Kunden verschickt werden, die NICHT die Produkte gekauft haben, die normalerweise zusammen gekauft werden, aber mindestens eines der meistverkauften Produkte gekauft HABEN. Das Unternehmen möchte, dass ich Daten zur Unterstützung dieser Kampagne liefere.
Mein Analyseprozess wird folgendermaßen aussehen:
- Untersuchen Sie die Daten.
- Finden Sie die meistverkauften Produkte (A).
- Finden Sie Produkte, die häufig mit Top-Produkten verkauft werden (B).
- Ermitteln Sie die Kundenpopulation, die A, aber nicht B gekauft haben.
- Stellen Sie dem Marketing geeignete Informationen zur Verfügung.
Für diesen Blog habe ich ein 8 AU (Actian Unit) Warehouse in der Google Cloud Platform erstellt. Eine Actian Unit ist ein Maß für die Cloud , das nach oben oder unten skaliert werden kann. Siehe Abbildung 1.

Meine ActianDatenbank hat ein typisches Einzelhandelsschema, aber für diesen Blog werde ich mich nur auf vier Tabellen konzentrieren. Siehe Abbildung 2.

Ich habe einen Datengenerator verwendet, um eine große Menge an Daten zu erzeugen, aber ich habe einige künstlich überlagerte Muster hinzugefügt, um diesen Blog interessanter zu machen. Meine Tabellen haben die folgende Anzahl von Zeilen:
Kunde | 5,182,631 |
Bestellung | 1,421,706,929 |
Einzelposten | 45,622,951,425 |
Produkt | 16,424 |
Ich kann nun die Tools in der ActianKonsole Query Editor verwenden, um meinen Analyseprozess auszuführen. Sie finden den Abfrage-Editor in der oberen rechten Ecke der Warehouse-Definitionsseite. Ich habe ihn in Abbildung 1 blau eingekreist.
Für alle Anfragen in diesem Blog habe ich die folgende Reihenfolge eingehalten: Ich habe meine Anfrage in den Anfrage eingegeben (1), die Anfrage (optional) formatiert (2), dann die Anfrage ausgeführt (3) und anschließend die Anfrage für spätere Verwendung gespeichert (4). Siehe das Sequenzlayout in Abbildung 3. Beachten Sie, dass Sie auch das Layout meines gesamten Schemas (roter Kreis) im Anfrage sehen können.

Untersuchen Sie die Daten
Zunächst möchte ich meine Daten verstehen, indem ich ein paar interessante Abfragen ausführe.
Ich möchte verstehen, welche Monate an Daten in meinem ActianWarehouse vorhanden sind und einige Gesamtzahlen verstehen. (Anmerkung: Dieser Blog wurde Anfang 2021 verfasst). Ich führe diese Abfrage aus:

Dank der Schnelligkeit von Actian konnte ich in nur wenigen Sekunden einige wertvolle Informationen aus meinem Lager abrufen. Es sieht so aus, als hätte ich Daten aus fünf Jahren mit über 45 Milliarden verkauften Artikeln und einem durchschnittlichen Umsatz von 625 Dollar. Das ist fantastisch! Siehe Abbildung 4.
Außerdem würde ich gerne die Entwicklung der Verkäufe nach Monaten sehen. Ich führe diese Anfrage aus:

Auch diese Anfrage war in wenigen Sekunden erledigt, aber bei all diesen großen Zahlen ist es etwas schwierig, ihre relativen Werte zu erfassen. Es wird hilfreich sein, ein Diagramm mit der Diagrammfunktion des Actian Anfrage Editors zu erstellen.
Ich habe die Diagrammfunktion (siehe Abbildung 6) verwendet, um ein Balkendiagramm zu erstellen. Ich verwende im Wesentlichen dieselbe Anfrage , habe sie aber vereinfacht und die Ausgabe auf das letzte Jahr beschränkt. Es ist nun leicht zu erkennen, dass meine Verkäufe um Weihnachten herum wirklich zugenommen haben. In Abbildung 7 habe ich gezeigt, wie ich dieses Diagramm konfiguriert habe.


Meistverkaufte Produkte finden (A)
Da ich nun meine Daten kenne, führe ich diese Anfrage aus, um die umsatzstärksten Produktkategorien nach Ausgaben im letzten Jahr zu ermitteln:

In nur wenigen Sekunden erfahre ich, dass Kleidung und Elektronik meine meistverkauften Produktkategorien insgesamt waren. Ich weiß, dass das Marketing immer gerne mit Elektronik arbeitet, also werde ich mich darauf konzentrieren.
Als nächstes möchte ich die meistverkauften Produkte im Bereich Elektronik des letzten Jahres finden. Ich führe diese Anfrage aus:

Dank der Geschwindigkeit von Actian erfahre ich in wenigen Sekunden, dass viele der Top-Produkte in meiner Kategorie Elektronik von Canon stammen. Siehe Abbildung 9.
Finden Sie Produkte, die häufig mit Top-Produkten verkauft werden (B)
Jetzt möchte ich die Elektronikprodukte finden, die in den letzten sechs Monaten am häufigsten mit diesen meistverkauften Canon Produkten verkauft wurden. Dies ist die ressourcenintensive Anfrage , auf die ich mich in meiner Einleitung bezogen habe. Bei der Ausführung dieser Anfrage werden meine 45 Milliarden Einzelposten mit denselben 45 Milliarden Einzelposten verbunden, um zu sehen, welche Artikel typischerweise zusammen gekauft werden. Ich führe diese Anfrage aus:

Diese Anfrage ist wesentlich komplexer als die vorherigen, dennoch dauerte die Ausführung in Actian nur 17 Sekunden. Aus dieser Anfrage ist ersichtlich, dass Canon-Kunden häufig SDHC-Speicherkarten verschiedener Typen kaufen. Das erscheint natürlich logisch, aber ich habe das jetzt mit Analytics nachgewiesen.
Finden Sie die Kundenpopulation, die A, aber nicht B gekauft hat
Jetzt muss ich die Namen und Adressen der Kunden finden, die KEINE Speicherkarten gekauft haben. Dies ist im Grunde eine umgekehrte Anfrage. Actian verknüpft die 45 Milliarden Zeilen umfassende Tabelle der Einzelposten wieder mit sich selbst, um fehlende Beziehungen zu finden, d. h. Kunden, die keine Speicherkarten gekauft haben. Anschließend müssen die Positions- und Bestellinformationen wieder mit der Kundentabelle verknüpft werden, um die entsprechenden Namens- und Adressinformationen zu erhalten. Außerdem muss ich sicherstellen, dass ich keine doppelten Mailings an Kunden sende, die möglicherweise mehrere Canon-Produkte gekauft haben, also habe ich das Schlüsselwort DISTINCT zu meiner SQL hinzugefügt. Ich führe die unten stehende Anfrage aus. Sobald sie beendet ist, wähle ich die Option .csv-Download, um eine Ausgabedatei zu erstellen. Siehe die roten Kreise in Abbildung 11.

Geeignete Informationen für das Marketing bereitstellen
Jetzt kann ich die .csv-Datei mit den potenziellen Kunden ganz einfach per E-Mail an den Vertrieb senden, damit dieser seine Marketing-Kampagne verschicken kann.

Zusammenfassend lässt sich sagen, dass das Actian Data Warehouse eine sehr leistungsfähige Cloud ist, die auch die grundlegenden Werkzeuge und die Geschwindigkeit enthält, die Sie benötigen, um mit Affinity Analytics in Ihrem Unternehmen produktiv zu sein.
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden: Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.