Analytische Datenbanken: Merkmale, Funktionen und Einsatzszenarien

Die Angebote für analytische Datenbanken unterscheiden sich in Funktion und Umfang. Ihre Implementierung sollte gut evaluiert und geplant sein.

Eine hohe Analyse-Performance für viele unterschiedliche Aufgabenstellungen bei gleichzeitig niedrigen Kosten –...

das ist das Versprechen Analytischer Datenbanken. Doch ihre Implementierung sollte nur nach vorheriger Evaluierung und Architekturbetrachtung erfolgen. Zu sehr unterscheiden sich die im Markt gebotenen Systeme. Und nicht immer sind sie die passende Lösung.

Wachsendes Bedürfnis nach analytischen Datenbanken

Die verstärkte Nachfrage nach Analytischen Datenbanken in den letzten Jahren ist vor allem eine Reaktion auf Beschränkungen historisch gewachsener Data-Warehouse-Lösungen. 

Der Wunsch in den Fachbereichen nach schneller Umsetzung von Anforderungen, einer integrierten Planung und Simulation, nach komplexeren und fortschrittlichen Analyseverfahren sowie häufigeren Datenaktualisierungen (Verminderung der Latenz) erfordern ein flexibles und effizientes Datenmanagement. Historisch gewachsene Data-Warehouse-Systeme sind hierfür meist zu komplex und zu umständlich zu handhaben.

Statt statischer Berichtsabfragen wird heute von der IT Agilität bei der Datenbereitstellung und -aufbereitung gefordert. Sie soll Fachanwendern größere Freiheiten bei der Analyse und Reporting gewähren (Stichwort: Self Service BI) und schnell auf Veränderungen und Wünsche reagieren können. 

Die Nutzung von Big Data bringt zahlreiche technische, konzeptionelle und organisatorische Änderungen mit sich.

Da dies in vielen Organisationen nicht gelingt oder die Reaktionszeiten lang sind, bauen Fachbereiche immer häufiger parallel zum Data Warehouse eigene analytische Systeme auf oder sie verlangen zumindest vehement mehr Engagement von ihrer IT.

Ein Überdenken der bisherigen Data-Warehouse-Architektur ist aber auch aufgrund neuartiger technischer Anforderungen an die Systeme notwendig geworden. Vor allem die Nutzung von Big Data bringt zahlreiche technische, konzeptionelle und organisatorische Änderungen mit sich. 

Eine zentrale Forderung ist beispielsweise, aus strukturierten und polystrukturierten Datenquellen experimentelle Big-Data-Analysen in völlig freien Datenräumen vornehmen zu können, also jenseits des von der IT qualitätsgesicherten Datenraums. Die bislang isoliert betriebenen Data-Warehouse-Systeme bieten diese Flexibilität nicht.

Und noch ein weiterer Faktor hat in der letzten Zeit den Handlungsdruck auf IT- und Business-Intelligence (BI) -Verantwortliche erhöht und das Interesse an analytischen Datenbanken gefördert: die hohen Systemkosten bisheriger Data-Warehouse-Umgebungen. So entfallen laut einer Umfrage von IBM durchschnittlich 65% der Zeit im Rechenzentrum auf die Systemwartung und Betrieb, und nur 35% auf die zur Umsetzung neuer Anforderungen.

Versprechen Analytischer Datenbanken

Analytische Datenbanken (ADB) sind Datenbank-Managementsysteme (DBMS), die sich aufgrund ihrer Architektur und Funktionen besonders gut für Datenanalysen eignen. Charakteristisch für solche Systeme sind ein reduzierter Plattenzugriff  (I/O) durch Datenspeicherverfahren, Verfahren zur Komprimierung und Caching, eine parallele Datenverarbeitung, abgestimmte Systemarchitekturen für einen hohen Datendurchsatz und eine vereinfachte Systemwartung (siehe Grafik).

Analytische Datenbanken sind kein Allheilmittel oder Ersatz für ein Data Warehouse.

Analytische Datenbanken sind als Software oder als Data Warehouse Appliance verfügbar. Letztere sind vorkonfigurierte Angebote aus Hardware und Software, die ein „ausgewogenes System“ für den einfachen Betrieb verheißen.

Analytische Datenbanken sind jedoch kein Allheilmittel oder Ersatz für ein Data Warehouse. Auch wird eine komplexe Datenarchitektur mit langen und inhaltlich vielfältigen Datenintegrationszyklen auch durch eine analytische Datenbank nicht besser, zumal viele Angebote im Markt bei der Datenbeladung ihre Besonderheiten beziehungsweise Schwächen zeigen.

Als Faustregel gilt, dass weniger reife Lösungen tendenziell zu Einschränkungen zugunsten einer einfacheren Wartbarkeit neigen. Reife Lösungen zeigen tendenziell weniger Einschränkungen auf, zulasten einer größeren Komplexität. Im ungünstigsten Fall kann eine ADB zudem längere Laufzeiten verursachen und die Komplexität im Datenmanagement erhöhen, statt sie zu reduzieren wie es ihre Fürsprecher sagen.

Die technischen Stärken und Besonderheiten analytischer Datenbanken sollen die Limitationen bisheriger Data-Warehouse-Systeme ausgleichen, werden diese aber nur selten ersetzen. Quelle: BARC

Nur wenn BI-Verantwortliche diese neuen Techniken systematisch evaluieren, können sie klären, ob der erhoffte Nutzen und die Vorteile einer Kombination von Data-Warehouse-Umgebung und analytische Datenbank erzielbar sind. Eine bloße Betrachtung der Systemeigenschaften einer ADB genügt nicht, vielmehr ist allein das konkrete Anwendungsszenario ausschlaggebend für die Bewertung. Folgende Kriterien spielen hierbei eine Rolle:

  • Datenvolumen;
  • Abfragefähigkeiten für Standardberichtsabfragen;
  • Ad-hoc-Abfragen und Analyseabfragen;
  • Datenpflegefähigkeiten;
  • gemischte Abfrage-/Lade- und Update-Performance;
  • technische Unterstützung von Self Service BI;
  • Anzahl der maximalen Anwender.

Markt für analytische Datenbanken

Seit 2012 ist die Nachfrage nach analytischen Datenbanken in der DACH-Region erheblich gestiegen, insbesondere rücken nun auch neue Datenbankspezialisten in den Fokus der Betrachtung. 

Anders als im bereits etablierten US-Markt, dominieren hierzulande lokale Anbieter den Markt – ein Umstand, der sich vor allem aus unterschiedlichen Marktkulturen und die Art und Weise, wie Hersteller auf ihre Kunden und Interessenten zugehen, erklärt.

Die BARC Produktstudie „Analytische Datenbanken“ sieht aktuell 18 ADBs mit relevanter Präsenz in der DACH-Region. 

Unter deren Anbietern finden sich eine Reihe junger Unternehmen, die seit mehreren Jahren für einen hohen Preisdruck auf die großen Datenbankhersteller sorgen und eine Reihe von Übernahmen und technischer Weiterentwicklungen getrieben haben.

Analytische Datenbanken sind derzeit in drei Formen erhältlich:

  1. Die Datenbank wird als Software auf einer Hardware installiert und konfiguriert. Abhängig von der Konfiguration sind unterschiedliche Anforderungsprofile möglich (zum Beispiel für Mixed Workloads, OLTP und Data Warehouse). Die höheren Freiheitsgrade bei der Konfiguration werden im Vergleich zu den anderen Lieferformen mit einem hohem Administrations- und Wartungsaufwand bezahlt.
  2. Data-Warehouse-Appliances: Vorinstallierte, vorkonfigurierte Datenbanksysteme mit abgestimmten Hardwarekomponenten, die für spezielle analytische Aufgaben optimiert sind. In einigen Lösungsansätzen übernehmen dedizierte Hardwarebausteine spezielle Datenbankaufgaben und steigern dadurch die Performance. Die Vorteile einer Data-Warehouse-Appliance liegen zudem in der schnelleren Installation und den niedrigen Wartungskosten sowie der Unabhängigkeit vom Expertenwissen für Konfiguration und Administration der Datenbank.
  3. Data as a Service (DaaS): Die Cloud-basierte Bereitstellung ist aktuell noch gering verbreitet, gewinnt aber an Aufmerksamkeit. Die Datenbank wird an einen entsprechenden Anbieter ausgelagert, der Datenspeicherung, die Wartung, Optimierung und Betrieb übernimmt. Der Zugriff auf die Daten kann direkt mit eigenen Anwenderwerkzeugen erfolgen. Viele Unternehmen sehen DaaS kritisch, weil diese Nutzungsform strenge Sicherheitsmaßnamen erfordert.

BARC-Empfehlung zu analytischen Datenbanken

Wachsende Flexibilitätsanforderungen, eine schlechte Abfrageperformance und der Wunsch nach fortschrittlichen Analysen bringen historisch gewachsene Data-Warehouse-Landschaften immer häufiger an Ihre Grenzen.

Doch zu glauben, analytische Datenbanken seien der Ausweg, kann in der Praxis für Verdruss sorgen, denn oftmals liegen die Ursachen schlechter Abfrageperformance, langer Umsetzungsprozesse, schlechter Wartbarkeit und hoher Kosten nicht in der Technologie, sondern in der Datenarchitektur und Datenmodellierung begründet. Vor allem zu lange und zu komplexe Ladestrecken finden sich heute in vielen Unternehmen. Analytisch optimierte Datenbank-Technologien helfen hier nur bedingt, wenn überhaupt.

Andererseits haben Analytische Datenbanken das Potential, Business Intelligence einen Leistungsschub zu verpassen und für eine bessere Abfrageperformance, niedrigere Kosten und höhere Skalierbarkeit zu sorgen. 

Einsatzszenarien analytischer Datenbanken sind daher im Vorfeld sorgfältig zu prüfen. Vor allem neuere Technologien sind meist für spezielle Einsatzfälle geeignet und bieten in den ersten Release-Versionen nur eingeschränkte Funktionen für das Datenmanagement, wodurch die Wartbarkeit erschwert ist.

Reifere Angebote können diesen Nachteil zwar wettmachen, sind dafür aber komplexer aufgebaut. Sorge bereitet heute sicher auch die Migration und Umschulung auf die neuen Datenbanken. Es sind aber aus BARC-Sicht ausreichend Best Practices und Methoden verfügbar, die den Aufwand für die Einführung und den Betrieb solcher Lösungen greifbar machen.

BARC empfiehlt vor der Auswahl neuer Technologie, die künftigen Anforderungen an ein DWH zu definieren und zu prüfen, inwieweit diese sich mit vorhandenen Lösungen abdecken lassen. Diese Analyse offenbart fachliche, technische und organisatorische Schwächen und Verbesserungspotentiale.

Entsprechend ist ein Zielbild zu definieren und an ihm zu entscheiden, ob die Einführung einer analytischen Datenbank als Data Warehouse oder Data Mart die adäquate Lösung für unterschiedliche Anforderungen in der Organisation sein kann. Ein Prototyp räumt weitere Unsicherheiten aus dem Weg und hilft Risiken zu kalkulieren. 

Auch sollten Unternehmen sich nicht nur an großen Herstellernamen bei der strategischen Entscheidung für die analytische Datenhaltung orientieren. Sie könnten sich Chancen verbauen, denn die Wahl eines etablierten Produkts per se ist kein Garant für eine erfolgreiche Umsetzung von Business Intelligence.

Letztlich muss ein Wandel auf strategischer, taktischer sowie auch operativer Ebene hin zu einem datenorientiertes Unternehmen mittel- und langfristig das Ziel sein. Nur so lässt sich ein effizientes und flexibel steuerbares Datenmanagement und Business Intelligence erreichen.

Dieser Beitrag ist original im "BARC-Guide Business Intelligence 2013/2014" erschienen - weitere Infos und Bestellmöglichkeiten: http://www.barc.de/bi-guide

Über die Autoren:
Sascha Alexander ist Head of Content & Marketing bei BARC.
Timm Grosser ist Analyst am Business Application Research Center (BARC) im Bereich Business Intelligence. Seine Spezialgebiete sind entscheidungsunterstützende Informationssysteme mit besonderem Fokus auf die Bereiche Datenqualität, Datenmanagement und Business Activity Monitoring.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im November 2014 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Big Data

0 Kommentare

Älteste Beiträge 

Passwort vergessen?

Kein Problem! Tragen Sie Ihre E-Mail-Adresse unten ein. Wir werden Ihnen eine E-Mail mit Ihrem Passwort schicken.

Ihr Passwort wurde an die folgende E-Mail-Adresse gesendet::

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close