Blog | Datenplattform | | 5 Min. Lesezeit

Wo die Datenverarbeitung stattfindet, ist entscheidend

Analytik Verarbeitung

Actian Vector wurde im Jahr 2026 in Actian Analytics Engine umbenannt.


Das „Vector for Hadoop“-Angebot von Actian sorgt für eine höhere Leistung bei analytischen Abfragen, ohne dass damit zusätzliche Kosten entstehen. Wenn Sie auf der Suche nach High-Performance sind, um Entscheidungsfindung operative Entscheidungsfindung voranzutreiben, kommt es darauf an, wo Sie die Verarbeitung durchführen. Durch die Minimierung des Datentransports und die lokale Verarbeitung können Sie die Latenzzeit drastisch reduzieren. Durch den Einsatz eines Systems wie der Actian Analytics Enginefür diese lokale Verarbeitung können Sie ein noch höheres Leistungsniveau erreichen.

Auf dem Gerät, im Rechenzentrum oder landesweit

Wenn man den Satz „Wo die Verarbeitung stattfindet, ist entscheidend“ hört, denkt man zunächst an die Netzwerklatenz. Es ist leicht nachvollziehbar, dass die Übertragung von Daten über das Internet, quer durch das Land oder sogar quer durch die Stadt die Verarbeitung verlangsamen kann. Das Gleiche gilt auch innerhalb Ihres Rechenzentrums. Die gemeinsame Unterbringung von Speicher und Rechenleistung in unmittelbarer Nähe (im selben Rack oder sogar auf demselben Gerät) verringert die Verarbeitungslatenz.

Viele Unternehmen nutzen Cloud und verteilte Systeme, um die Leistungbei OLTP-VorgängenNutzer zu steigern. Wenn es um die Durchführung von Analysen geht, spielt das Problem der Entfernung erneut eine Rolle. Wo sollten Sie Ihre Analyseprozesse durchführen? Für die meisten Unternehmen Cloud die Cloud der richtige Ort, um ihr Data Warehouse zu hosten und Analyseberechnungen durchzuführen, da sie es ermöglicht, die Analysen näher an den Datenspeichern anzusiedeln und gleichzeitig Rechenressourcen Cloud zu nutzen.

Angenommen, Sie haben diese Probleme im Zusammenhang mit „großen Entfernungen“ gelöst – gibt es noch Möglichkeiten zur weiteren Optimierung? Ja, die gibt es. Wenn es um Big Data oder Echtzeitanalysen zur Steuerung von Betriebsabläufen und Entscheidungsfindung Ihre Ziele Entscheidungsfindung , müssen Sie Ihre Analytics-Performance die nächste Stufe heben und prüfen, wie die von Ihnen verwendeten Datenbanken und Software optimiert werden können, um die verfügbaren Ressourcenkapazitäten optimal zu nutzen.

Die Festplatte ist langsam. Der Arbeitsspeicher ist schneller. Der Chip-Cache ist am schnellsten.

Werfen wir einen Blick darauf, was in einem Analysesystem (der von Ihnen verwendeten Hardware und Software) vor sich geht. Diese Systeme bestehen in der Regel aus drei Hardwarekomponenten, die einen direkten Einfluss auf die Leistung haben: Festplatten, Arbeitsspeicher und Chip-Cache. Wenn Sie Rechenoperationen ausführen (die im Grunde nur eine Reihe mathematischer Formeln sind), bearbeiten Sie Daten, die an einem dieser drei Orte gespeichert sind. Chips verfügen über einen internen Cache-Speicher, der die höchste Geschwindigkeit, aber die geringste Kapazität bietet. RAM-Speicherchips haben mehr Kapazität (wenn auch begrenzt) und eine recht hohe Leistung, da Daten vorübergehend in einem ruhenden Zustand gehalten werden, anstatt auf ein physisches Medium geschrieben zu werden; sie sind jedoch deutlich langsamer als der Chip-Cache. Festplattenspeicher ist am langsamsten, da Daten auf ein physisches Medium (eine Festplatte) geschrieben und bei Bedarf von diesem physischen Medium gelesen werden. Bei Cloud ist die verfügbare Festplattenkapazität nahezu unbegrenzt.

Data-Warehouse- und Analysesysteme nutzen jede dieser Speicherarten sowie die Rechenleistung der CPUs auf unterschiedliche Weise. Genau darin liegt der Leistungsvorteil der Actian Analytics Engine gegenüber anderen Lösungen. Die Analytics Engine optimiert die Nutzung jeder Ebene der Systeminfrastruktur, wodurch Kapazitätsverschwendung vermieden wird, um sowohl die Leistung zu maximieren als auch die Kosten zu minimieren. Hier sind einige Beispiele:

Auslastung der CPU maximieren

Moderne CPUs verfügen über mehrere Kerne, was bedeutet, dass sie mehrere Operationen gleichzeitig ausführen können. Leider ist die meiste Software (einschließlich Data-Warehouse-Systeme) nicht darauf ausgelegt, diese Parallelverarbeitungsfähigkeit zu nutzen, sodass letztlich nur ein kleiner Teil der verfügbaren Kapazität ausgeschöpft wird. Die Actian Data Platform und die Actian Analytics Engine sind darauf ausgelegt, eine große Anzahl gleichzeitiger Abfragen, die von einer Vielzahl von Benutzern angefordert werden, effizient auszuführen. Abfragen werden in kleine Blöcke aufgeteilt, die parallel ausgeführt werden können. Dies ist wichtig, da es die Nutzung Ihrer verfügbaren CPU maximiert. CPU sind zeitbasierte Kapazitäten. Stellen Sie sich das wie die Stunden am Tag vor, die Ihnen für Arbeitsaufgaben zur Verfügung stehen. Die Herausforderung besteht darin, Ihre verfügbare Kapazität möglichst effizient zu nutzen und Leerlaufzeiten zu vermeiden, denn sobald die Zeit verstrichen ist, können Sie sie nie wieder zurückgewinnen.

Reduzierung der Datenmenge, die auf Festplatten geschrieben und von diesen gelesen wird

Actian solutions are designed for highly efficient use of disks – reducing I/O operations that can slow down analytics processing. Actian Data Platform is a pure columnar database. Traditional databases are row-based – records are in rows, and you have to read the entire row to perform a query and do analytics. Actian treats data as a series of columns – this is what optimizes it for analytics processing. Because a column of data is all the same data type, analytics operations can be optimized. Going under the hood, you’ll find that each column is stored as files on the disk with various blocks of data. MinMax indexes on data blocks enable faster sorting of data by helping the platform to more efficiently identify what data the user is trying to analyze and what can be ignored.

Wenn Sie Betriebsanalysen durchführen und versuchen, Entscheidungsfindung in Echtzeit Entscheidungsfindung Daten voranzutreiben, benötigen Sie die bestmögliche Leistung. Durch eine Kombination aus vermehrten Operationen, die über den Chip-Cache und den Cache-Speicher abgewickelt werden, sowie einem effizienteren Verfahren zur Verwaltung der auf Festplatte gespeicherten Daten kann Actian die Leistung und Auslastung der Datenbankhardware optimieren und gleichzeitig die Menge der auf Festplatte geschriebenen Daten minimieren.  Beides ist wichtig, da es sich direkt in niedrigeren Betriebskosten niederschlägt. Im Endeffekt geht es darum, „die vorhandenen Ressourcen effizienter zu nutzen“, um Spitzenleistung zu erzielen und Kosten zu minimieren.