Relationale Open-Source-Datenbanksysteme – eine Übersicht

Anhand von fünf Beispielen gibt dieser Beitrag einen Überblick zum Angebot an relationalen OS-Datenbanken.

Dieser Artikel behandelt

DBMS

Als Herzstück von Business Intelligence- bzw. Data Warehouse-Architekturen fungieren nach wie vor die zentralen...

Datenbanksysteme. Bei größeren, vielleicht unternehmensweiten Lösungen werden häufig relationale Datenbanksysteme genutzt, um das oftmals umfangreiche Datenvolumen in Tabellenform abzulegen und nutzen zu können.

Heute sind diverse quelloffene Angebote verfügbar, die sich durch hohe Leistungsfähigkeit und Stabilität auszeichnen. Aus der Fülle der verfügbaren Produkte in diesem Umfeld sollen hier fünf Exemplare (Firebird, Ingres, MaxDB, MySQL und Postgres) detaillierter vorgestellt werden, die sich durch große Verbreitung und/ oder Bekanntheit besonders auszeichnen. 

Neben diesen Vertretern ihrer Zunft kann insbesondere noch auf die Lösungen SQLite (www.SQLite.org), HyperSQL (www.hsqldb.org) und Derby (db.apache.org/derby) verwiesen werden, für deren Vorstellung hier leider kein Platz bleibt. Weitere quelloffene Datenbanksysteme werden in (Höpfer; Levin 2007) und (Roden; Lauer 2010) kurz beschrieben.

Firebird

Das Open Source Datenbanksystem Firebird liegt derzeit in der Version 2.1.3 vom 8. September 2009 vor (Stand: Februar 2010) und ist unter der IDPL-Lizenz (abgeleitet aus der Mozilla Public License) frei nutzbar. Die historischen Wurzeln des Systems finden sich im kommerziellen Datenbanksystem InterBase (CodeGear, ehemals Borland), aus dem es im Jahre 2000 abgespalten wurde. 

Firebird unterstützt diverse Betriebssysteme, so verschiedene Unix-Derivate (u. a. AIS, Solaris, HP-UX und LinuX) sowie Windows. Kostenlos verfügbar sind zahlreiche Treiber und Bibliotheken (z. B. für Delphi, Free Pascal, Perl, Python, ODBC, .NET, PHP, C++ und Java), die eine Ansteuerung des Datenbankservers aus einem eigenen Anwendungsprogramm heraus ermöglichen.

Firebird bietet alle grundlegenden Funktionen, die für den Aufbau und die Nutzung einer relationalen Datenbank erforderlich sind. Dazu gehören sowohl unterschiedliche SQL-Dialekte, die pro angelegter Datenbank definiert werden können, als auch ein Transaktionsmanagement sowie Mechanismen zur Gewährleistung referentieller Integrität. Darüber hinaus sind Trigger und Stored Procedures verfügbar. Zudem lassen sich User Defined Functions hinterlegen.

SAP MaxDB - The SAP database system

Das relationale Datenbankmanagementsystem MaxDB (bis 2004 mit der Bezeichnung SAP DB) gehört in der aktuellen Version 7.7 (Stand: Februar 2010) zum Produktportfolio des Walldorfer Softwareanbieters SAP und eignet sich durchaus als Speicherkomponente für unternehmensweite Anwendungen mit hohem Datenvolumen (bis in den Terabyte-Bereich) und zahlreichen Anwendern. 

Die nunmehr seit mehr als 30 Jahren andauernde, historische Entwicklung des Datenbank-systems kann als sehr wechselhaft bezeichnet werden.

Bis einschließlich Version 7.6 ist MaxDB im Rahmen einer kostenlosen Community-Lizenz quelloffen nutzbar. Für den Betrieb nachfolgender Versionen in SAP-Anwendungsumgebungen sind die Lizenz- und Vertragsregularien der SAP AG zu beachten. MaxDB zeichnet sich ebenfalls durch die Unterstützung der verbreiteten Unix- und Windows-Betriebssysteme sowie durch diverse Schnittstellen wie beispielsweise ODBC und JDBC, aber auch zu Perl- und Python-Modulen aus.

Die nunmehr seit mehr als 30 Jahren andauernde, historische Entwicklung des Datenbanksystems kann als sehr wechselhaft bezeichnet werden. Zunächst im Jahre 1977 als Forschungsprojekt an der TU Berlin unter Rudolf Munz begonnen (Projektbezeichnung: „Distributed Databases on Mini-Computers“), übernahm Nixdorf Computer in den 1980er Jahren die Weiterentwicklung und den Vertrieb (vgl. Horstmann 2006, S. 189). 

Im Jahre 1992 erwarb die Software AG die Rechte am System und vermarktete es mit großem Bekanntheitsgrad als Adabas D, das auch für die Datenhaltung im SAP-Bereich (SAP R/3) eingesetzt werden konnte. Ab 1997 bot SAP eine eigene Entwicklungslinie einschließlich Support und Wartung unter der Bezeichnung SAP DB an.

INGRES

Neben den üblichen Datenbank-Funktionalitäten, bei denen der unterbrechungsfreie Betrieb mit 24 Stunden mal 7 Tage Verfügbarkeit heraussticht, ist als Besonderheit hier ein SAP BW (Business Information Warehouse) Feature Pack besonders erwähnenswert, das verschiedene Optionen zur Beschleunigung von Datenbankabfragen bei multidimensionalen Datenstrukturen bietet, wie Table Clustering, Table Compression und Join Optimization (vgl. SAP 2007).

Das quelloffene relationale Datenbanksystem Ingres (interactive graphics retrieval system, aktuelle Version 9.3, Stand: Februar 2010) wurde initial vom legendären amerikanischen Datenbankpionier Michael Stonebraker und seiner Forschergruppe an der University of Berkeley, Kalifornien, in den 1970er Jahren entwickelt. 

Nach diversen Besitzern (u. a. Computer Associates, die bisweilen für den unzureichenden Markterfolg des Datenbank-Produktes verantwortlich gemacht werden) wird Ingres seit 2006 von der Ingres Corporation als quelloffenes System angeboten. Derzeit zeichnet sich Ingres durch verstärkte Präsenz auf Tagungen und Kongressen auch auf dem deutschen Markt aus und versucht, verlorene Anteile am Geschäft mit Datenbanken zurückzugewinnen.

In Kooperation mit Jaspersoft vermarktet Ingres eine kombinierte Out-of-the-Box-Lösung aus unterschiedlichen Open-Source-Komponenten unter der Bezeichnung Ingres Icebreaker BI Appliance, mit der vor allem der Aufwand bei Installation und Update deutlich reduziert werden soll (vgl. Bloemen; Grosser; Hauskrecht 2009, S. 25).

MySQL

Als bekanntestes und sicherlich am meisten verbreitete der hier vorgestellten Open Source Datenbanksysteme gilt MySQL, derzeit in der Version 5.5 (MySQL Community Server Version 5.1, Stand: Februar 2010) abrufbar. Ursprünglich vom schwedischen Softwareunternehmen MySQL AB in einer kommerziellen und einer freien Version federführend entwickelt, gingen die Eigentumsrechte mit dem Kauf von MySQL AB im Februar 2008 auf das Unternehmen Sun Microsystems über, bevor dieses wiederherum im Januar 2010 vollständig von Oracle übernommen wurde. 

Derzeit ist MySQL weiterhin einerseits als kostenlose Open Source Version (GPL-Lizenz) und andererseits als kommerzielle Enterprise Variante erhältlich. Verfügbar ist MySQL sowohl für unterschiedliche Unix-Varianten sowie Mac OS X als auch für Windows, OS/2 und i5/OS (ehemals OS/400).

Als bekanntestes und sicherlich am meisten verbreitete der hier vorgestellten Open Source Datenbanksysteme gilt MySQL.

Weite Verbreitung erfuhr MySQL vor allem durch den Einsatz als Datenbanksystem in Web-Umgebungen, in denen es dann oftmals in Verbindung mit dem Apache Webserver und PHP zur Anwendung gelangt.

Als Besonderheit von MySQL kann die Unterstützung unterschiedlicher Speichersubsysteme (Engines) gewertet werden, wobei die einzelnen Engines jeweils spezifische Stärken aufweisen und daher in unterschiedlichen Anwendungsszenarien zum Einsatz gelangen. Die einzelnen Subsysteme leisten autonom eine Transaktions- und Indexverwaltung. 

Als verbreitetste Speichersysteme in diesem Kontext gelten MyISAM (indexsequentielle Speicherung ohne Transaktionsverwaltung) und InnoDB (transaktionssichere Schreib- und Lesezugriffe in Tabellen mit Unterstützung von Fremdschlüsselbeziehungen). Daneben existieren aber auch Angebote wie Memory (Speicherung der Daten zur Laufzeit im Arbeitsspeicher) oder CSV (kommaseparierte Ablage der Daten).

Zur Nutzung von MySQL als Administrator oder Anwender existieren unterschiedliche Werkzeuge, die entweder als Kommandozeilen-Befehlssammlung oder – anwenderfreundlicher – mit grafischer Oberfläche (wie MySQL Administrator und MySQL Query Browser) zur Verfügung stehen.

MySQL bietet zahlreiche Funktionalitäten, die auch bei der Erstellung von Data Warehouses von Interesse sind. Version 5 enthält Datensichten (Views), Trigger, Stored Procedures und User Defined Functions. Vor allem die Option zur Partitionierung von Tabellen erweist sich in umfangreichen Datenbeständen als essentiell zur Gewährleistung eines guten Antwortzeitverhaltens. 

Daneben ist auch die Möglichkeit zum Betrieb von MySQL in einem Computercluster als wünschenswert und teilweise erforderlich. Zur Nutzung von MySQL in sehr großen Data Warehouse-Umgebungen kann auf das Speichersubsystem aus dem Hause Infobright mit der Bezeichnung BrightHouse (ebenfalls als freie Community Edition und kostenpflichtige Enterprise Edition erhältlich) zurückgegriffen werden.

BrightHouse zeichnet sich vor allem durch seine Fähigkeit zur Komprimierung von Rohdaten um den Faktor 10 aus, insbesondere durch eine spaltenbasierte Form der Datenablage auf den Speichermedien (vgl. Bloemen; Grosser; Hauskrecht 2009, S. 28). Darüber hinaus werden Datenbank-Statistiken zur Verbesserung von Kompression und Performance analytisch ausgewertet.

PostgreSQL

Das objektrelationale PostgreSQL-Datenbanksystem, das ursprünglich als Nachfolgeprojekt zu Ingres unter der Bezeichnung Postgres in den 1980er Jahren ebenfalls von Michael Stonebraker an der University of Berkeley initiiert wurde, gilt heute als das vielleicht fortschrittlichste seiner Klasse. Seit 1997 wird die Software als Open-Source-System (BSD-Lizenz) weiterentwickelt und ist heute in der Version 8.4 verfügbar (Stand: Februar 2010).

Postgres zeichnet sich durch besonders reichhaltige Funktionalitäten aus, die sich an allgemeinen Normen und Standards orientieren (z. B. ANSI-SQL). Hervorzuheben sind das ausgereifte Transaktionskonzept sowie die vorhandenen Mechanismen zur Gewährleistung referentieller Integrität. 

Unterstützt werden darüber hinaus auch sehr komplexe Abfragen, die beispielsweise geschachtelte Unterabfragen (Subselects) enthalten können. Zum Standardumfang von Postgres gehören weiterhin Datensichten (Views), auf die auch schreibend zugegriffen werden kann (Updatable Views). 

Trigger und Stored Procedures sind ebenso enthalten, wie Schnittstellen zu diversen Programmiersprachen (z. B. Perl, PHP, Python, C++ und Java) und Zugriffsmöglichkeiten via ODBC und .NET. Betrieben werden kann Postgres unter verschiedenen Unix-Derivaten, aber auch unter Windows-Betriebssystemen.

Eine große Anzahl optionaler Zusatzmodule lassen sich nutzen, um den Funktionsumfang für spezielle Anwendungsbereiche zu vergrößern. So stehen Erweiterungsmodule für die Verwaltung geografischer Informationen, für die Volltextsuche in Datenbankobjekten sowie für Clusterung, Replikation und Parallelisierung zur Verfügung.

Eine speziell auf die Belange von Data Warehousing- und Business Intelligence-Anforderungen ausgerichtete Variante von PostgreSQL findet sich mit Bizgres, die vom Unternehmen Greenplum federführend entwickelt und ebenfalls unter der BSD-Lizenz vertrieben wurde (vgl. Bloemen; Grosser; Hauskrecht 2009, S. 27 und Horstmann 2006, S. 190). 

Bitmap-Indizierung sowie verbesserte Sortier- und Lade-Laufzeiten versprechen hier Performance-Gewinn im Betrieb. Allerdings scheint die Zukunft der Lösung ungewiss, da sich keine aktuellen Informationen zum Projekt mehr finden lassen und auch die zugehörige Homepage (http://www.bizgres.org/) nicht mehr betrieben wird.

Über die Autoren:
Mario Ettelt (Dipl.-Wirt. Inf. ) ist wissenschaftlicher Mitarbeiter der TU Chemnitz.

Peter Gluchowski beschäftigt sich seit rund 20 Jahren mit Fragestellungen, die den praktischen Aufbau dispositiver bzw. Analytischer Systeme zur Entscheidungsunterstützung betreffen. Seine Erfahrungen aus unterschiedlichsten Praxisprojekten sind in zahlreichen Veröffentlichungen zu diesem Themenkreis dokumentiert.

Melanie Pfoh ist wissenschaftliche Mitarbeiterin, TU Chemnitz, Professur für Produktionswirtschaft und Industriebetriebslehre.

Literaturempfehlungen zum Thema:
AccelIT; EOS Directory; Optaros: Open Source Katalog 2009 - 354 Produkte/ Projekte für den Unternehmenseinsatz. Zürich 2009, abgerufen 03.2010, http://www.rm-informatik.ch/pdf/opensourcekatalog2009.pdf.

Bloemen, Jacqueline; Grosser, Timm; Hauskrecht, Alexander: Open Source Data Warehousing und Datenintegration - Chancen, Risiken und Kostenaspekte. BARC-Institut, Würzburg 2009.

Gluchowski, Peter, Chamoni, Peter: Entwicklungslinien und Architekturkonzepte des On-Line Analytical Processing. In: Chamoni, Peter; Gluchowski, Peter: Analytische Informationssysteme. Berlin/Heidelberg 2006, S. 143-176.

Gluchowski, Peter; Schieder, Christian:. Open Source Business Intelligence - Acht quelloffene Werkzeuge für Reporting, OLAP und Data Mining im Vergleich. BARC-Institut, 2009. www.barc.de/osbi

Höpfner, Hagen; Levin, Patrick: Open-Source-Datenbankmanagementsysteme - ein Überblick. In: Datenbank-Spektrum, Heft 22, August 2007, S. 5 - 12.

Horstmann, Jutta: Freie Datenbanken im Unternehmenseinsatz - Analyse und Vergleich der wichtigsten Open-Source-Datenbanken. In: Lutterbeck, Bernd; Bärwolff, Matthias; Gehring, Robert A. (Hrsg.): Open Source Jahrbuch 2006, Zwischen Softwareentwicklung und Gesellschaftsmodell. Lehmanns Media, Berlin 2006, S. 181-201.

SAP AG: MaxDB Support Workshop - BW Feature Pack. Berlin 2007, abgerufen am 17.02.2010. http://maxdb.sap.com/training/Miscellaneous/SWS2007-BW-FP.pdf.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im November 2010 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Datenbank-Management-Systeme (DBMS)

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close