Es kommt darauf an, wo Sie die Analyseverarbeitung durchführen
Actian Vector wurde im Jahr 2026 in Actian Analytics Engine umbenannt.
Das „Vector for Hadoop“-Angebot von Actian sorgt für eine höhere Leistung bei analytischen Abfragen, ohne dass damit zusätzliche Kosten entstehen. Wenn Sie auf der Suche nach High-Performance sind, um Entscheidungsfindung operative Entscheidungsfindung voranzutreiben, kommt es darauf an, wo Sie die Verarbeitung durchführen. Durch die Minimierung des Datentransports und die lokale Verarbeitung können Sie die Latenzzeit drastisch reduzieren. Durch den Einsatz eines Systems wie der Actian Analytics Enginefür diese lokale Verarbeitung können Sie ein noch höheres Leistungsniveau erreichen.
Auf der Box, im Rechenzentrum oder auf der anderen Seite des Landes
Wenn man die Aussage hört, dass es darauf ankommt, wo man seine Daten verarbeitet, denkt man zuerst an die Netzwerklatenz. Es ist leicht zu verstehen, dass die Übertragung von Daten über das Internet, quer durch das Land oder sogar quer durch die Stadt, die Verarbeitung verlangsamen kann. Das Gleiche gilt für Ihr Rechenzentrum. Die gemeinsame Unterbringung von Speicher und Datenverarbeitung in der Nähe (im selben Rack oder sogar im selben Gerät) verringert die Verarbeitungslatenz.
Viele Unternehmen nutzen Cloud und verteilte Systeme, um die Leistung fürEndnutzer-OLTP-Vorgänge zu erhöhen. Wenn es an der Zeit ist, Analysen durchzuführen, kommt wieder das Problem der Entfernung ins Spiel. Wo sollten Sie Ihre Analyseverarbeitung durchführen? Für die meisten Unternehmen ist die Cloud der richtige Ort, um Ihr Data Warehouse zu hosten und die Analyseberechnungen durchzuführen, da Sie so Ihre Analysen näher an Ihren Datenspeichern platzieren und gleichzeitig Rechenressourcen Cloud nutzen können.
Angenommen, Sie haben diese "großen Entfernungsprobleme" gelöst, ist es dann möglich, weiter zu optimieren? Ja, das ist möglich. Wenn Big Data oder Echtzeitanalysen zur Steuerung von Abläufen und zur Entscheidungsfindung anstreben, müssen Sie Ihre Analytics-Performance auf die nächste Stufe heben und prüfen, wie die von Ihnen verwendeten Datenbanken und die Software optimiert werden können, um die verfügbare Ressourcenkapazität maximal auszunutzen.
Festplatte ist langsam. Speicher ist besser. Chip-Cache ist am schnellsten
Werfen wir einen Blick auf die Vorgänge in einem Analysesystem (die von Ihnen verwendete Hardware und Software). Diese Systeme bestehen in der Regel aus drei Hardwarekomponenten, die einen direkten Einfluss auf die Leistung haben: Festplatten, Speicher und Chip-Cache. Wenn Sie Rechenoperationen durchführen (bei denen es sich eigentlich nur um einen Haufen mathematischer Formeln handelt), bearbeiten Sie Daten, die an einem dieser drei Orte gespeichert sind. Chips haben einen internen Cache-Speicher, der die schnellste Leistung, aber die geringste Kapazität bietet. RAM-Speicherchips haben eine größere Kapazität (die allerdings begrenzt ist) und eine recht schnelle Leistung, da die Daten vorübergehend in einem Schwebezustand gehalten werden, anstatt auf ein physisches Medium geschrieben zu werden, sind aber viel langsamer als der Chip-Cache. Festplattenspeicher sind am langsamsten, da die Daten auf ein physisches Medium (eine Festplatte) geschrieben und von diesem Medium gelesen werden, wenn auf sie zugegriffen werden muss. Bei der Cloud ist die verfügbare Festplattenkapazität nahezu unbegrenzt.
Data-Warehouse- und Analysesysteme nutzen jede dieser Speicherarten sowie die Rechenleistung der CPUs auf unterschiedliche Weise. Genau darin liegt der Leistungsvorteil der Actian Analytics Engine gegenüber anderen Lösungen. Die Analytics Engine optimiert die Nutzung jeder Ebene der Systeminfrastruktur, wodurch Kapazitätsverschwendung vermieden wird, um sowohl die Leistung zu maximieren als auch die Kosten zu minimieren. Hier sind einige Beispiele:
Maximierung der Auslastung der CPU
Moderne CPUs verfügen über mehrere Kerne, was bedeutet, dass sie mehrere Operationen gleichzeitig ausführen können. Leider ist die meiste Software (einschließlich Data-Warehouse-Systeme) nicht darauf ausgelegt, diese Parallelverarbeitungsfähigkeit zu nutzen, sodass letztlich nur ein kleiner Teil der verfügbaren Kapazität ausgeschöpft wird. Die Actian Data Platform und die Actian Analytics Engine sind darauf ausgelegt, eine große Anzahl gleichzeitiger Abfragen, die von einer Vielzahl von Benutzern angefordert werden, effizient auszuführen. Abfragen werden in kleine Blöcke aufgeteilt, die parallel ausgeführt werden können. Dies ist wichtig, da es die Nutzung Ihrer verfügbaren CPU maximiert. CPU sind zeitbasierte Kapazitäten. Stellen Sie sich das wie die Stunden am Tag vor, die Ihnen für Arbeitsaufgaben zur Verfügung stehen. Die Herausforderung besteht darin, Ihre verfügbare Kapazität möglichst effizient zu nutzen und Leerlaufzeiten zu vermeiden, denn sobald die Zeit verstrichen ist, können Sie sie nie wieder zurückgewinnen.
Verringerung der Datenmenge, die auf Festplatten geschrieben und von ihnen gelesen wird
ActianLösungen sind auf eine hocheffiziente Nutzung der Festplatten ausgelegt und reduzieren so die E/A-Vorgänge, die die Verarbeitung von Analysen verlangsamen können. Actian Data Platform ist eine rein spaltenbasierte Datenbank. Herkömmliche Datenbanken sind zeilenbasiert - Datensätze befinden sich in Zeilen, und Sie müssen die gesamte Zeile lesen, um eine Abfrage durchzuführen und Analysen zu erstellen. Actian behandelt Daten als eine Reihe von Spalten - das ist es, was sie für die analytische Verarbeitung optimiert. Da alle Daten in einer Spalte vom gleichen Datentyp sind, können Analysevorgänge optimiert werden. Wenn Sie unter die Haube schauen, werden Sie feststellen, dass jede Spalte als Dateien mit verschiedenen Datenblöcken auf der Festplatte gespeichert ist. MinMax-Indizes auf Datenblöcken ermöglichen eine schnellere Sortierung der Daten, indem sie der Plattform helfen, effizienter zu erkennen, welche Daten der Benutzer zu analysieren versucht und welche ignoriert werden können.
Wenn Sie betriebliche Analysen durchführen und versuchen, die Entscheidungsfindung mit Daten in Echtzeit voranzutreiben, brauchen Sie die bestmögliche Leistung, die Sie bekommen können. Durch eine Kombination aus vermehrten Operationen im Chip-Cache und Cache-Speicher sowie einer effizienteren Verwaltung der auf der Festplatte gespeicherten Daten kann Actian die Leistung und Auslastung der Datenbank-Hardware optimieren und gleichzeitig die Menge der auf die Festplatte geschriebenen Daten minimieren. Beides ist wichtig, weil es sich direkt in geringere Betriebskosten umsetzt. Im Endeffekt geht es darum, die vorhandenen Ressourcen effizienter zu nutzen, um Spitzenleistungen zu erzielen und die Kosten zu minimieren.