Microsoft PDW: Warten auf Version 2

Mit Parallel Data Warehouse bietet Microsoft eine analytische Datenbank. Die für 2013 angekündigte Version 2.0 soll einige Beschränkungen aufheben.

Dieser Artikel behandelt

BI-Technologie

Mit dem SQL Server Parallel Data Warehouse hat Microsoft eine leistungsfähige, analytische Datenbank ins Rennen...

um Unternehmenskunden geschickt. Doch erst die für 2013 angekündigte Version 2.0 soll mit einer Reihe von Beschränkungen aufräumen und eine attraktivere Lizenzierung bringen.

Microsoft PDW ist eine vorkonfigurierte Data-Warehouse-Appliance, welche eine massiv-parallele Datenbank (MPP/Shared nothing), mit Server-Hardware von Hewlett-Packard oder Dell kombiniert. Das Angebot markiert Microsofts Vorstoß seine Datenbanktechnologie auch für große Data Warehouse Projekte zu erweitern, die bisher von den etablierten Anbietern IBM, Oracle und Teradata dominiert werden.

Bislang gibt es laut Microsoft weltweit rund 50 PDW-Kunden, von denen allerdings nur neun mit der Appliance auch produktiv gegangen sind. So kam hierzulande beispielsweise ein großes Anwenderunternehmen nach einer ersten detaillierten Bewertung des PDW zum dem Schluss, dass der ersten Version noch benötigte Funktionen fehlten. Auch unsere Einschätzung ist, dass ein Data Warehouse heute grundsätzlich noch nicht vollständig (ohne Workarounds) auf PDW lauffähig ist.

Umso größer sind die Hoffnungen, die Anwender mit der jetzt für das 1.Quartal 2013 angekündigten Version 2.0 verbinden. Sie beseitigt aus unserer Sicht die meisten der noch in PDW 1.0 existierenden technischen Limitierungen. Zudem wird dann Dank geänderter Konfigurationsmöglichkeiten ein kostengünstigerer Einstieg möglich und die Microsoft Lösung damit auch für mittelständische Unternehmen erschwinglich. Bisher muss ein Kunde bereits für die Einstiegskonfiguration der Appliance ein Control-Rack plus ein voll ausgebauten Rack mit „Compute Nodes“ mit einer Speicherkapazität und Leistung für mehr als 100 Terabyte Daten erwerben. Dies war zumindest in Deutschland den allermeisten Kunden wohl zu viel.

Kleinere Einstiegskonfigurationen

Mit PDW 2.0 will Microsoft die Einstiegskonfiguration auf ein Viertel Rack mit Compute Nodes und einer Speicherkapazität von etwa 20 Terabyte Daten reduzieren. Zudem wurde die Konfiguration des Control-Racks flexibler gestaltet und muss nicht mehr grundsätzlich mit einem Backup-Node und Landingzone-Node ausgestattet sein, sondern ist nun optional. Erste Einblicke zeigen auch Neuerungen in der Systemarchitektur, die höhere Flexibilität und Skalierbarkeit erwarten lassen.

Des Weiteren ergänzt Microsoft mit Version 2.0 die analytischen Funktionen der Datenbanksoftware des PDW. Diese stellt eine parallelisierte Version des Microsoft SQL Servers dar, in der sich auch Funktionen des vor drei Jahren zugekauften Anbieter Datallegro wiederfinden. Version 2.0 soll nun beispielsweise eine spaltenorientierte Speicherung für die Daten ermöglichen.

Das Microsoft Big Data Angebot

Um PDW baut sich das Big-Data-Angebot von Microsoft auf. Im Mittelpunkt steht dabei die Vision einer umfassenden Plattform, die mit bekannten Werkzeugen wie Excel und Sharepoint die Analyse sowohl strukturierter als auch unstrukturierter Daten ermöglicht. Die Integration des unstrukturierten Wissensgutes ist dabei die neue Herausforderung für den Hersteller, der hierzu künftig auf eine Microsoft-optimierte Hortonworks-Hadoop-Distribution setzt. 

Der Zugriff auf die neuen Daten kann auf unterschiedlichen Wegen erfolgen: über den SQL Server, über das PDW in Form virtueller Datenbanken oder per Datenbank-Funktionsaufruf. Eine Alternative bietet die direkte Zugriffsmöglichkeit des Analysewerkzeuges PowerPivot auf Hive – eine relationale Instanzierung von Daten auf dem Hadoop-Dateisystem.

Mit enthalten in der Microsoft-Big-Data-Plattform sind bekannte Technologien aus dem SQL-Server-Angebot, eine Streaming-Datenbank, der SharePoint Server sowie ein von Microsoft entwickeltes Web-Frontend zur Verwaltung und Erstellung von Big-Data-Anwendungen namens HDInsight.

Insgesamt wirkt das ganze Portfolio mit all seinen Werkzeugen noch recht zusammengewürfelt und muss die Güte der Integration seiner Teile, die Handhabung und Benutzerfreundlichkeit noch unter Beweis stellen. Dies trifft allerdings auch für andere Big-Data-Angebote anderer IT-Generalisten zu, die mit ähnlichen „Architekturen“ werben. Auch sie streben eine umfassende Plattform an – bestehend aus unterschiedlichsten Tools und Engines – auf der alle Analyseanfragen beantwortet werden können.

Der schwere Weg ins High-End

Insgesamt bleibt abzuwarten, ob Microsoft über technischen Neuerungen in Version 2.0 und den Preis tatsächlich der etablierten Konkurrenz im Highend-Segment des Data-Warehousing-Markts gefährlich werden kann. Aus unserer Sicht konzentriert sich der Hersteller bislang bei der Entwicklung und Vermarktung des PDW trotz der genannten neuen Möglichkeiten zur Erschließung neuer Datenquellen vor allem auf die eigenen Kunden und sein Portfolio. 

Ferner kann zu diesem Zeitpunkt nichts über die Leistungsfähigkeit der Appliance etwa im Vergleich zu Teradata, Oracle Exadata oder IBM Infosphere Warehouse (DB2) gesagt werden, weil Vergleichsdaten fehlen. Selbst für Microsoft ist PDW immer noch eine neue und wenig erprobte Technologie. Und für die meisten Microsoft-Partner stellt sich PDW aktuell wohl eher als Überforderung dar.

Über den Autor:

Dr. Carsten Bange ist geschäftsführender Gesellschafter des Business Application Research Centers (BARC). Er ist seit mehr als 10 Jahren für nationale und internationale Unternehmen verschiedenster Branchen und Größen im Rahmen der Strategie- und Architekturberatung, Werkzeugauswahl und Qualitätssicherung in Business-Intelligence- und Datenmanagement-Projekten tätig. Als neutraler Beobachter des Softwaremarktes ist er ein häufiger Redner bei Tagungen und Seminaren sowie Autor zahlreicher Fachpublikationen und Marktstudien.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im November 2012 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über BI-Technologie

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close