Neue EMC-Plattform für die Big-Data-Analyse

Big DataData & StorageNetzwerkeStorage
EMC Symetrix V-Max Server Storage

Die von EMC entwickelte Greenplum-DCA-Plattform verbindet eine Verarbeitungsarchitektur (Massively Parallel Processing, MPP), die Daten über alle Knoten eines Clusters verteilt, mit Apache Hadoop in einer einheitlichen Anwendung. Dadurch lassen sich strukturierte und unstrukturierte Daten einfacher analysieren und weiterverarbeiten. Durch den modularen Aufbau können Unternehmen die Plattform flexibel anpassen und mithilfe der Greenplum Data Integration Accelerators erweitern, beispielsweise um Business-Intelligence- und Data-Warehousing-Lösungen.

Die Infrastruktur der Greenplum-DCA-Plattform besteht aus vier verschiedenen Modulen. Greenplum Database Modul ist ein hochskalierbares Data-Warehousing-Appliance-Modul, das mit seiner Architektur Datenbank-, Computing-, Storage- und Netzwerk-Funktionalitäten in einem System vereint. Greenplum Database High Capacity Modul dient für das Hosting von mehreren Petabyte Daten, ohne den Stromverbrauch, die Kosten oder den Platzbedarf massiv in die Höhe zu treiben. Greenplum HD Modul enthält ein Appliance-Modul auf Hadoop-Basis für das Co-Processing von Daten innerhalb einer einheitlichen Lösung. Greenplum Data Integration Accelerator (DIA) Modul dient als Hostsystem für Analyse-Applikationen von Partnern, wobei diese denselben Interconnect mit niedriger Latenz wie die anderen Appliance-Module nutzen.

»Die Möglichkeit, große Mengen an strukturierten und unstrukturierten Daten zu analysieren und die Informationen für sich zu nutzen bietet Unternehmen zukünftig Wettbewerbsvorteile und reduziert die Komplexität der IT-Infrastruktur «, erläutert Uwe Weimer, VP Central and Eastern Europe Data Computing Division bei EMC. »In Verbindung mit der DCA Plattform können Unternehmen zukünftig ihr Data Warehouse für die Auswertung und Weiterverarbeitung großer Datenmengen optimieren und zudem die Effizienz der Datenanalyse steigern.«

Für den Einstieg in die Big-Data-Analyse benötigen Unternehmen ein Primär-Rack, das ein Standard- oder ein High-Capacity-Greenplum Database Quarter-Rack-Modul enthält und Platz für drei weitere Module bietet. Zusätzlich sind zwei Master-Server nötig, die die Authentifizierung, Anfrageoptimierung, Workload-Balancing zwischen den Segment-Servern, das Management des Fehlertoleranzmechanismus für Daten übernehmen.

Lesen Sie auch :