Eine Übersicht von Open Source OLAP-Tools

Eine Übersicht von Open Source OLAP-Tools und Open Source BI-Tools, zusammengestellt von Mario Ettelt,Peter Gluchowski und Melanie Pfoh OLAP.

Dieser Artikel behandelt

Datenvisualisierung

Der umfassende Einsatz von Business Intelligence (BI) in Unternehmen führt zur Nutzung einer Vielzahl heterogener...

Anwendungssysteme beziehungsweise Softwarewerkzeuge aus verschiedenen Kategorien. Ein zentrales Segment bilden hierbei die Softwaretools des On-Line Analytical Processing (OLAP), welches die Anordnung betriebswirtschaftlich relevanter Daten in multidimensionalen Strukturen in den Vordergrund rückt. 

So erlauben OLAP-Werkzeuge den Zugriff, die Analyse und die Darstellung der Daten aus verschiedenen Perspektiven und korrespondieren dabei mit der geschäftsorientierten Betrachtungsweise der Entscheidungsträger auf den Datenbestand (vgl. Gluchowski; Chamoni 2006). Zu den Kernfunktionen von OLAP-Anwendungen zählen insbesondere die multidimensionale („Slicing & Dicing“) und die (dis-)aggregierende Datenanalyse („Drill Down & Roll Up“).

Als Hauptunterscheidungsmerkmal zwischen verschiedenen OLAP-Systemen erweisen sich die verwendeten Datenhaltungskonzepte. Das Relationale OLAP (ROLAP) nutzt zur Datenhaltung unter Zuhilfenahme spezieller Datenmodelle (Star- oder Galaxy-Schemata) relationale Datenbanksysteme. 

Als Haupt- unterscheidungs- merkmal zwischen verschiedenen OLAP-Systemen erweisen sich die verwendeten Datenhaltungs- konzepte.

Im Vergleich dazu sind die Datenstrukturen beim Multidimensionalen OLAP (MOLAP) auch physisch multidimensional angelegt. Der Vorteil dieser Vorgehensweise im Vergleich zum ROLAP liegt in der schnellen Antwortzeit vor allem auch durch die rasche Bildung dynamischer Aggregationen auf höheren Abstraktionslevels zur Laufzeit („on the fly“). 

Dafür eignet sich ROLAP besser zur Verwaltung und Nutzbarmachung sehr umfangreicher Datenbeständen. Der Ansatz des Hybriden OLAP (HOLAP) zielt darauf ab, als Mischform die Vorteile der beiden Alternativen zu nutzen sowie deren Nachteile zu mildern.

Für diese spezielle Kategorie von Business Intelligence-Werkzeugen steigen die Quantität, die Qualität und auch die Verbreitung von Open Source Alternativen im Vergleich mit kommerziellen Angeboten stetig an. 

Hierzu zählen insbesondere Produkte wie Palo, Mondrian, JPivot, Cubulus, OpenOLAP for MySQL, OpenOLAP for PostgreSQL oder Pentaho Analysis Mondrian beziehungsweise JasperAnalysis. Die beiden Erstgenannten sind die wohl bekanntesten und am stärksten verbreiteten Vertreter ihrer Art – zumindest im deutschsprachigen Raum.

Der vorliegende Überblick umfasst sowohl Lösung zur Datenhaltung, die auf ROLAP- und MOLAP-Architekturen basieren, als auch Front-End-Werkzeuge zur Anwendung der beschriebenen OLAP-Funktionalitäten und zur adäquaten Präsentation der Ergebnisse.

MOLAP versus ROLAP

Bei Palo handelt es sich um einen InMemory-MOLAP-Server, der über ein Client-Front-End (Excel-Addin) gesteuert und genutzt wird. Zusätzlich sind weitere Bausteine wie ein ETL-Server und eine Webumgebung verfügbar, die gemeinsam mit den Datenbank-Komponenten die Palo-Suite bilden. 

Im Gegensatz dazu handelt es sich bei Mondrian um einen ROLAP-Server, der auf relationale Datenbanksysteme zur Datenhaltung zurückgreift und oftmals gemeinsam mit JPivot für die Präsentation der Ergebnisse und Analysen zum Einsatz kommt. Zudem verwenden bekannte Open-Source-BI-Suiten wie Pentaho oder Jasper dieses Bundle für die Umsetzung von OLAP-Funktionalitäten.

Ebenso wie viele andere Vertreter der Open-Source-Software verhelfen auch diese beiden Werkzeuge durch ihre Verfügbarkeit und relativ unproblematische Installation zum schnellen Arbeiten. Dennoch benötigen Anwender hin und wieder Hinweise und Hilfestellungen zur Bedienung sowie fachliche und technische Hilfestellungen. 

Communities zur Arbeitserleichterung nutzen

Anders als bei der kommerziellen Konkurrenz sind umfangreiche Dokumentationen nicht unbedingt verfügbar. Das wohl am häufigsten genutzte und erfolgversprechendste Mittel zur Selbsthilfe sind die Communities, welche Diskussionsforen und Wikis zur technischen und fachlichen Hilfestellung unterhalten. 

Die Communities beider Werkzeuge erweisen sich als äußerst aktiv und aktuell, so dass der Anwender nicht lange auf gehaltvolle Antworten warten muss. Gegen entsprechende finanzielle Gegenleistung bieten die federführenden Entwickler der Produkte (Jedox AG und Pentaho Corp.) zusätzliche Schulungsprogramme, Webinare und telefonischen Support an.

Die Installation beider Tools funktioniert relativ einfach. Lediglich bei Verwendung der Stand-Alone-Variante von Mondrian/JPivot benötigt der Nutzer Know-How im Umgang mit Web- und Applikationsservern. Auf derzeit gängigen Systemkonfigurationen sind beide Werkzeuge bei Verfügbarkeit von Pentium 4 Prozessoren sowie ausreichend Arbeits- und Festplattenspeicher (jeweils circa 1-2 GB) unmittelbar lauffähig.

Anders als bei der kommerziellen Konkurrenz sind umfangreiche Dokumentationen nicht unbedingt verfügbar.

Unabhängig vom realisierten Datenhaltungskonzept des OLAP-Systems (MOLAP oder ROLAP) sind diverse Schnittstellen und Verbindungsmöglichkeiten zu den Vorsystemen für eine nutzbare Architekturkomponente unabdingbar. Mondrian verfügt über keine eigene Datenhaltungskomponente, sondern bedient sich vielmehr der Dienste relationaler Datenbanksysteme, zumeist über JDBC-Treiber. 

Dagegen erfolgt die multidimensionale Datenabfrage durch den Endanwender bzw. die eingesetzten Front-End-Tools über MDX-Statements. Palo als Vertreter der MOLAP-Tools verfügt über eine eigene Datenhaltungskomponente. Dennoch sind Verbindungsmöglichkeiten im Rahmen von ETL-Prozessen zur Beladung der Datenhaltungskomponente erforderlich. 

Hierzu stehen zahlreiche integrierte Verbindungstypen mit entsprechenden Treibern zur Verfügung, darunter auch zu namhaften relationalen Datenbanksystemen wie beispielsweise Oracle oder DB2. Im BI-Umfeld sowie speziell im Rahmen der Informationsversorgung für Entscheidungsträger erfolgt die Verarbeitung und Analyse vertraulicher betriebswirtschaftlicher Kennzahlen. 

Jedes moderne OLAP-Tool muss deshalb in der Lage sein, besondere Analysen und Berichte vor dem Zugriff Unbefugter zu schützen. Palo bietet hierfür eine gut strukturierte Benutzer- und Gruppenverwaltung an. 

Eine multidimensionale Datenabfrage erstellen

Zunächst legt der Administrator sämtliche Benutzer inklusive ihrer Anmeldeinformationen an, die in einem nächsten Schritt zu Gruppen zusammengesetzt werden. Schließlich sind den Gruppen für einzelne Berichtsordner Zugriffsrechte zu erteilen.

Zum Rechte- beziehungsweise Benutzermanagement greift Mondrian auf den zugehörigen Applikationsserver zurück. In den BI-Suiten von Pentaho und Jaspersoft, die Mondrian und JPivot als OLAP-Komponenten nutzen, übernehmen die jeweiligen Web-Server diese Aufgabe. Beide Umgebungen realisieren den Nutzerzugriff über Webschnittstellen, über die auch die Steuerung der Werkzeuge erfolgt.

Zum Basisfunktionsumfang moderner OLAP-Anwendungen gehören die grundlegenden Navigationsfunktionen in Bezug auf multidimensionale Datenwürfel. So unterstützen beide Werkzeuge das „Slicing“ und „Dicing“ durch interaktive Auswahlmöglichkeiten der Zeilen- und Spaltentitel durch den Nutzer. 

Weiterhin kann neben Filterfunktionen auch das Expandieren von Dimensionselementen in beiden Richtungen des Aggregationspfades (Aggregation oder Detaillierung) realisiert werden. Palo bietet seinen Anwendern zusätzlich die Option, in einer Excel-Arbeitsmappe Pivot-Tabellen mehrerer Datenwürfel simultan anzuzeigen. 

Beide Werkzeuge stellen die Abfrageergebnisse sowohl tabellarisch, als auch in grafischer Form dar. Das Anlegen der zugrunde liegenden Datenstrukturen wie Dimensionen und Hierarchien wird bei beiden Vertretern über spezielle Client-Tools vorgenommen.

Mit dem entsprechende Werkzeug für Mondrian können XML-Beschreibungen des Würfelschemas sowie MDX-Statements zur multidimensionalen Datenabfrage erstellt werden. Klassischerweise dienen OLAP-Anwendungen lediglich der Datenabfrage auf multidimensionalen Strukturen sowie der Visualisierung der Ergebnisse in geeigneter Form. 

Entgegen dieses Verständnisses sind Palo-Anwender in der Lage, Daten zurückzuschreiben. Dabei können auch bereits aggregierte Feldinhalte verändert werden. Diese Änderung wirkt sich auf alle abhängigen Felder aus und eignet sich so hervorragend für Planungszwecke. Schließlich ist bei der Betrachtung der Werkzeuge die Palette an Formatierungsmöglichkeiten für Berichtslayouts von großer Bedeutung. 

Corporate Identity durch Style-Vorlagen umsetzen

Um dem Gedanken der Corporate Identity auch im Berichtswesen umzusetzen, sollten sich Style-Vorlagen als Corporate Design für Berichte verwenden lassen. Die beiden hier betrachteten Werkzeuge verfügen jeweils über eine Vielzahl an Berichtselementen und zugehörigen Formatierungsmöglichkeiten. Bei Palo sind nahezu alle aus Microsoft Excel bekannten Formatierungsmöglichkeiten verfügbar, sowohl für das Layout der Pivot-Tabellen, als auch für Diagramme. 

Durch die einheitlich verwendete Web-Oberfläche von JPivot weist Mondrian-OLAP-Berichten weniger umfangreiche Funktionalitäten zur Umsetzung individueller Styles oder zur Nutzung eventueller Vorlagen auf. Dennoch ist das Layout der Berichte durch den Nutzer stetig anpassbar, beispielsweise durch Filteroptionen, verwendbare Drill-Through-Tabellen sowie freie Anordnung von Zeilen-, Spalten- und Seitentiteln.

Das Thema Wiederverwendbarkeit spielt bei der Betrachtung von OLAP-Anwendungen ebenfalls eine starke Rolle. In beiden Werkzeugen lassen sich einmal erzeugte und gesicherte Berichte leicht wieder öffnen und verbreiten. 

Zusätzlich gehören Exportfunktionen für die reinen Daten oder den gesamten Bericht in gängige Formate wie XLS oder PDF sowie der Druck der Berichte zum Standardfunktionsumfang. Somit besteht die Möglichkeit, die Daten einer Abfrage komfortabel anderen Programmen, wie beispielsweise Data Mining-Anwendungen, zur weiteren Verarbeitung zuzuführen.

Über die Autoren:
Mario Ettelt ist wissenschaftlicher Mitarbeiter der TU Chemnitz. Peter Gluchowski beschäftigt sich seit rund 20 Jahren mit Fragestellungen, die den praktischen Aufbau dispositiver bzw. Analytischer Systeme zur Entscheidungsunterstützung betreffen. Seine Erfahrungen aus unterschiedlichsten Praxisprojekten sind in zahlreichen Veröffentlichungen zu diesem Themenkreis dokumentiert. Melanie Pfoh ist wissenschaftliche Mitarbeiterin, TU Chemnitz, Professur für Produktionswirtschaft und Industriebetriebslehre.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im September 2010 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Datenvisualisierung

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close