Daten-Intelligenz

Wenn BIG Data nicht sein müssen

Maria Schulte

Januar 9, 2018

Kind im Anzug denkt über big data nach

Schnelle und einfache Big Data mit einer Vector FARM

Ich bin seit langem in der IT-Branche tätig. Was vorbei ist, ist vorbei. Mein Lieblingsbeispiel ist, wie aus dem zentralisierten Mainframe-Timesharing das dezentralisierte Client-Server-Computing hervorging, und jetzt kehren wir zum Timesharing zurück, allerdings in der Cloud. Die Technologie entwickelt sich weiter. Manchmal scheinen neue Ideen gut zu sein, aber sie erweisen sich als nicht so gut, so dass wir zurückgehen und ältere, aber bewährte Ideen neu erfinden.

Nehmen Sie zum Beispiel Data Warehousing und Big Data . Wir alle sammeln all diese big data an, die nicht ohne Weiteres auf einem kleinen Computer Platz finden. Also erstellen wir einen riesigen Computer oder, noch besser, einen Cluster kleiner Computer, der wie ein riesiger Computer aussieht, um die Workload zu bewältigen.

Die Verwaltung von Computer-Clustern IST SCHWER

Cluster  big data

Auf dem Papier, wie in diesem Diagramm, sieht der Cluster einfach aus, aber in der Realität sind sie komplex einzurichten, schwer im Gleichgewicht zu halten und am Laufen zu halten, sie führen einen Haufen neuer Probleme ein, wie z.B. Sharding-Skew und Workload , und sie sind tatsächlich nicht so einfach zu erweitern... es ist verrückt! Das ganze Ökosystem ist anfällig und schwierig.

Wenn Sie nicht zu den wenigen Unternehmen gehören, die wirklich einen großen, einzigartigen Datensatz haben, ist das Ideal eines riesigen, zentralisierten Data Warehouse für alles aus praktischer Sicht einfach nicht so produktiv oder notwendig. Warum sollte man sich die Dinge schwerer machen als sie sein müssen?

Was mehr Sinn macht, ist eine leistungsfähige, leicht verständliche, einfach einzurichtende, leicht zu verwalten und leicht zu ändernde Umgebung. Für die Analytik schlage ich vor, einen Schritt zurückzutreten und einzelne Server in Betracht zu ziehen, die jedoch leistungsfähig und leicht zu verwalten sind.

Ziehen Sie eine Vector Farm in Betracht, um Unternehmensziele einfach zu erfassen.

Vector Farms können sehr flexibel sein. Sie können eine homogene Vector Farm haben, in der Sie eine Sammlung von einzelnen Servern haben, die alle gleich aussehen und auf denen jeweils die gleiche Actian Vector Konfiguration installiert ist. Die Verwaltung ist einfach, denn: Jeder Server ist unabhängig, so dass es keine Cluster gibt, jeder hat die gleiche Datenbank-Einrichtung und es ist einfach, Server hinzuzufügen oder zu löschen, ohne die anderen zu beeinträchtigen. Außerdem erfordert Actian Vector selbst wenig bis gar kein Tuning, so dass es kaum individuelle Einstellungen gibt. Sie können sogar leichte Variationen einführen, so dass Sie eine heterogene Vector Farm haben. In diesem Fall kann das Anwendungssetup zwar ein wenig anders sein, aber das ist kein Problem. Actian Vector bietet extreme Leistung und einfache Handhabung, ohne die Komplexität eines Cluster. Hier einige Beispiele:

Unabhängige Gruppen von gleichartigen Nutzern, die dieselbe Anwendung verwenden, aber getrennte Daten benötigen

Dieses Szenario ist das einfachste. Die Vector Farm ist besonders nützlich, weil sie eine einfache Trennung der Benutzerdaten ermöglicht. Ein Beispiel hierfür könnte ein multinationales Unternehmen sein, das rechtlich gesehen die europäischen Daten On-Premises und getrennt von den kanadischen und US-amerikanischen Daten aufbewahren muss usw. Beachten Sie hier, dass bei der Einrichtung des Datenbankservers alles gleich ist, auch der Name der Datenbank. Die Verwaltung all dieser Server ist die gleiche. Actian Vector bietet allen Benutzern eine enorme Abfrageleistung.

Homogene Vektorfarm

Unabhängige Gruppen von Benutzern unterschiedlicher Größe, die dieselbe Anwendung verwenden, aber unterschiedliche Daten benötigen

In der Realität sind die meisten Benutzergruppen nicht gleich. Nehmen Sie zum Beispiel einen Software-as-a-Service-Anbieter (SAAS). Ein SAAS-Anbieter könnte einen Cloud für eine Vielzahl von großen und kleinen Kunden über das Internet anbieten. In diesem Fall würde der Anbieter sicherlich nicht einen ganzen Server (virtuell oder On-Premises) für sehr kleine Kunden reservieren wollen. In diesem Fall kann der Anbieter mit Hilfe von Schemata (einer Methode zur Schaffung getrennter Eigentumsverhältnisse in einer einzelnen Datenbank) die Nutzung durch kleine Kunden auf einer Vector-Instanz bündeln, während er andere mit eigenen Instanzen bedient. In Fällen, in denen es sich um einen besonders großen Kunden handelt, kann er den Server größer machen, aber dennoch die gleiche Struktur beibehalten. Die Verwaltung all dieser Server ist mit Hilfe von Schemata immer noch gleich. Actian Vector bietet allen Benutzern eine enorme Anfrage .

Schemata mit Vektorfarm

Eine SEHR große Gruppe von anspruchsvollen Nutzern

Ein anderes Szenario ist, wenn die analytische Nutzer groß ist und diese Nutzer eine zuverlässige, schnelle Leistung benötigen. Ein Beispiel hierfür ist ein Finanzdienstleistungsunternehmen, das eine Handelsanwendung anbietet. Die Händler benötigen sehr schnelle, komplexe Analysen von Echtzeit . Ein komplexer Cluster mit seinem Overhead an vielen beweglichen Teilen kann dies physisch nicht leisten. In diesem Szenario kann eine homogene Vector Farm als Pool verwendet werden, um alle Benutzer zu bedienen. Ein Echtzeit-Service-Bus oder eine Nachrichtenwarteschlange kann zur Synchronisierung der Mehrfach-Server in Echtzeit verwendet werden. Die Benutzer werden auf einen beliebigen der verfügbaren Server in der Farm verteilt. Auch hier ist die Verwaltung einfach, da alle Server exakt gleich sind. Actian Vector (THE WORLD'S FASTEST Analytics Database) bietet enorme Antwortzeiten.

vektor bauernhof groß

Unabhängige Nutzer und Anwendungen

Das letzte Szenario ist eine wirklich heterogene Vektorfarm. In diesem Szenario sind die Nutzer nicht unbedingt segmentiert, sondern es gibt verschiedene Analyseanwendungen mit unterschiedlichen Datenbankstrukturen. Die Anwendungen sind unterschiedlich, so dass es keine operative Notwendigkeit gibt, Daten an einem zentralen Ort auf einem komplexen Cluster zu halten. Da Actian Vector so performant, einfach einzurichten und verwalten ist, ist eine Vector Farm ein effektiver Weg, um die Unterstützung dieser Anwender und Anwendungen zu erleichtern.

unabhängige Nutzer Vektorfarm

Schlussfolgerung

Warum sollten Sie sich mit einem komplexen Cluster quälen, wenn Sie es nicht müssen. Aufgrund der Leistung, der einfachen Verwaltung und des geringen bis gar nicht erforderlichen Custom Tunings ist es einfach, die Vorteile einzelner Server in einer Actian Vector Farm zu nutzen. Da Sie sich nicht mit der komplexen Analyse des Aufbaus und der Wartung eines Cluster befassen müssen und da Vector nur wenig Tuning erfordert, können Sie die Komponenten Ihrer Vector Farm schnell in Betrieb nehmen und sofort mit der "Ernte" des Geschäftswerts beginnen!

Mehr über Actian Vector

Möchten Sie mehr über Actian Vector erfahren ?

Sie können Actian Vector auch herunterladen und selbst ausprobieren (oder Sie können die Vector Community Edition auf AWS ausprobieren, ohne eine Evaluierungslizenz erwerben zu müssen). Sie werden nicht enttäuscht sein, und wenn Sie Hilfe brauchen, fragen Sie einfach die Community.

mary schulte headshot

Über Mary Schulte

Mary Schulte ist Senior Sales Engineer bei Actian. Sie verbrachte den größten Teil ihrer beruflichen Laufbahn bei führenden Datenbankanbietern wie Informix, Netezza und jetzt Actian. Mehr als zwei Jahrzehnte lang arbeitete sie ausschließlich mit Informix als Beraterin in einer Boutique-Consulting-Firma, später dann als Trainerin und Vertriebsingenieurin für Informix Corp. und später für IBM. Sie hat Tausende von Zeilen von Informix 4GL- und ESQL/C-Programmen für Kunden in verschiedenen Branchen weltweit geschrieben. Von Dallas aus arbeitete sie eng mit American Airlines an der bahnbrechenden Implementierung der damals neuen Informix Datablade-Technologie in den späten 1990er Jahren. Mary ist seit 2006 bei Actian und arbeitet hauptsächlich mit der Vector Analytics-Datenbanktechnologie. Sie ist der Meinung, dass es ein Glücksfall war, dass IBM eine Vereinbarung mit HCL getroffen hat und dass HCL Actian übernommen hat, weil sie jetzt wieder mit ihrem geliebten Informix arbeitet!