Datenarchitektur

Alle Cloud Data Warehouses sind NICHT gleich geschaffen

Actian Germany GmbH

14. Januar 2020

Cloud Data Warehouse

Es gibt viele Mythen und Missverständnisse über Cloud Data Warehouses. Einer der größten ist, dass alle Cloud das Gleiche kosten. Oberflächlich betrachtet mögen die Anbieter von Cloud die gleiche Sprache sprechen - sie beschreiben ähnliche Funktionen und Vorteile und preisen die Leistungssteigerung durch den Betrieb in der Cloud an. Doch wenn man sich die Details der Implementierung, Migrationsleistung und scalability ansieht, werden die Unterschiede deutlich.

"Wir verlagern unser Data Warehouse in die Cloud , um Geld zu sparen."

Die Migration von einem On-Premises zu einem Cloud ist eine gute Möglichkeit, eine bessere Kontrolle über Ihre IT-Kosten zu erlangen, die Leistung zu verbessern und scalability zur Unterstützung Ihres Unternehmens zu erreichen. Inwieweit Sie von diesen Vorteilen profitieren, hängt davon ab, welches Cloud Data Warehouse Sie auswählen und wie Sie es implementieren. Die meistenCloud-Data-Warehouse-Lösungen bieten Ihnen einige Deployment : On-Premises, private Cloud, öffentliche Cloud, Cloud und Hybrid. Wenn die Lösung, die Sie in Betracht ziehen, Ihnen diese Möglichkeiten nicht bietet, sollten Sie hier innehalten und überlegen, wie viel Vertrauen Sie in die Lösung haben, die Sie implementieren.

Die Deployment geben Ihnen die Flexibilität, den Kurs in der Zukunft zu ändern (und wenn man bedenkt, wie schnell sich Geschäftsumgebungen entwickeln, ist Flexibilität unerlässlich). Wenn Sie davon ausgehen, dass die Lösungen, die Sie in Betracht ziehen, die Deployment bieten, könnten Sie davon ausgehen, dass die Kosten und die Leistung praktisch gleich sind - schließlich handelt es sich bei AWS um dieselbe Cloud , oder?

Die Cloud , ob öffentlich oder privat, ist nur ein Teil des Leistungspuzzles. Die meisten Cloud bieten eine Vielzahl von Funktionen an, aus denen Anbieter von Softwarelösungen wählen können. Das Design und die Konfiguration der Lösung haben einen erheblichen Einfluss auf Ihre Kosten und die Leistungsvorteile, die Sie bei Ihrer Implementierung erhalten. Hier sind drei wichtige Punkte, die Sie verstehen sollten, um zu wissen, wie Ihre Cloud abschneidet.

Elastizität zur Minimierung von Verschwendung und Skalierung bei steigender Nachfrage

Eines der wichtigsten Argumente für die Verlagerung Ihres Data Warehouse in die Cloud ist die Minimierung der Verschwendung, die durch nicht ausgelastete Infrastruktur und ungenutzte Kapazitäten entsteht. Cloud sind dafür gedacht, für Spitzenbedarfszeiten hochgefahren und dann wieder heruntergefahren zu werden, wenn die Kapazität nicht benötigt wird, um Ressourcen (und Kosten) zu sparen. Bei Cloud hat jeder Anbieter seine eigenen Funktionen zur Optimierung der Ressourcennutzung (Angebot) gegenüber dem Verbrauch (Nachfrage). Einige Lösungen erfordern vollständige Datenbanksicherungen, um Dienste abzuschalten und eine vollständige Wiederherstellung, um den Dienst wieder in Betrieb zu nehmen. Das bedeutet, dass es nicht praktikabel ist, "das Licht auszuschalten, wenn man nicht im Büro ist".

Andere Cloud gehen bei der Kapazitätserweiterung schrittweise vor und fügen neue Instanzen für jeweils etwa acht Benutzer hinzu. Das bedeutet, dass Sie am Ende für mehr bezahlen, als Sie wirklich brauchen. Der Schlüssel zu Elastizität und Skalierung liegt in der genauen Kontrolle darüber, wie viel Kapazität Sie nutzen (und bezahlen), und in der Möglichkeit, diese nach oben oder unten zu korrigieren, um sie an Ihre individuellen Nutzungsmuster anzupassen. Wenn Sie eine bessere Kontrolle über Ihre Kosten haben, können Sie die Verschwendung minimieren und Geld sparen.

Leistung - Vergewissern Sie sich, dass Sie verstehen, was Sie in einer "Ressourceneinheit" erhalten.

In On-Premises ist es einfach zu messen, welche Ressourcen Sie nutzen: diesen Host, diesen Speicher und diese CPUs. Woher wissen wir das? Weil das die Hardware ist, auf der mein Data Warehouse läuft. Da die Infrastruktur in der Cloud für die gemeinsame Nutzung optimiert wurde, definieren die Anbieter "Ressourceneinheiten", um die Kapazität auf einfache Weise zu beschreiben. Die Sache hat jedoch einen Haken: Nicht alle Ressourceneinheiten sind gleich, und jeder Anbieter definiert seine eigene Maßeinheit. Sie müssen verstehen, was Sie in einer Ressourceneinheit in Bezug auf Geschwindigkeit, Leistung, Skalierung und Ressourcengröße erhalten. In einigen Fällen sind Dinge wie Arbeitsspeicher mit Rechenleistung gebündelt, in anderen Fällen werden sie separat gemessen. Lesen Sie das Kleingedruckte, damit Sie wissen, was Sie bekommen.

Effizienz und Parallelverarbeitung

Die parallele Verarbeitung ist eines der größten Unterscheidungsmerkmale zwischen Cloud . Wenn Sie Daten auf lineare Weise verarbeiten (eine Aufzeichnung nach der anderen), dauert die Verarbeitung big data lange. Einige Anbieter beschleunigen die Verarbeitung, indem sie mehrere Transaktionen parallel über eine Reihe verschiedener CPUs laufen lassen. Das ist schneller als eine einzelne Aufzeichnung, aber es gibt noch eine weitere Option, die noch schneller ist. Die Vektorisierung von Daten ermöglicht die Ausführung mehrerer Transaktionen in einem einzigen CPU . Dies bedeutet, dass Sie die Geschwindigkeit der parallelen Verarbeitung ohne die Overhead-Kosten der parallelen Hardware erhalten.

Es gibt viele Mythen über Cloud Data Warehouses, und dies war nur einer von ihnen.

Actian Data Platform

Actian Data Platform ist auf hohe Leistung ausgelegt und maximiert die Effizienz von Rechen-, Speicher- und Festplattensystemen - und ermöglicht so Hochgeschwindigkeitsanalysen in kürzerer Zeit und zu wesentlich geringeren Kosten als Snowflake.

actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, Verwaltung und Analyse von Daten in Cloud-, Hybrid- und lokalen Umgebungen. Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und -analyse liefert Actian leistungsstarke Lösungen, die es Unternehmen ermöglichen, datengesteuerte Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und wurde für seine Leistung und Innovation mit Branchenpreisen ausgezeichnet. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im ActianBlog behandeln wir Themen wie Echtzeit-Dateneingabe, Datenanalyse, Data Governance, Datenmanagement, Datenqualität, Datenintelligenz und KI-gesteuerte Analysen.