Neue Datenbank-Technologien stellen DBMS-Mainstream in Frage

Wachsende Datenmengen und innovative Ansätze im Database Management verändern die klassischen DBMS-Verfahren und bringen neue Möglichkeiten.

Dieser Artikel behandelt

DBMS

In letzter Zeit macht sich in der IT-Branche überall der Einfluss von unkonventionellen Datenbank-Technologien bemerkbar. Durch diese werden insbesondere die traditionellen Konzepte in Frage gestellt, auf denen die Entwicklung und der Einsatz von Systemen zum relationalen Datenbank-Managements (RDBMS) beruhen.

NoSQL-Datenbanken, Spalten-orientierte Datenbanken sowie Database as a Service (DaaS) sind natürlich keine völlig neuen Phänomene, aber in letzter Zeit sind sowohl die Anbieter als auch die potentiellen Nutzer zunehmend auf sie aufmerksam geworden. Die Gründe für das gestiegene Interesse an diesen neu aufkommenden Technologien lassen sich wohl in einem Wort zusammenfassen: Geschwindigkeit.

In vielen IT-Abteilungen hat man mit der Schwierigkeit zu kämpfen, dass man einerseits die Komplexität eines schnell wachsenden Datenbestands beherrschen muss und andererseits gehalten ist, unternehmenskritische Transaktionen und Suchanfragen für Business Intelligence (BI) zuverlässig und dennoch mit immer größerer Geschwindigkeit zu verarbeiten. Im Zeitalter von „Big Data“, so zumindest die Ansicht einiger Experten, könnten Spalten-orientierte Datenbanken, NoSQL-Engines und Cloud-basierte DaaS-Lösungen hier durchaus helfen, und zwar durch bessere Performance, größere Flexibilität sowie eine mögliche Senkung der Gesamtbetriebskosten.

Analysten weisen jedoch darauf hin, dass sich die hochgelobten Technologien noch in einem frühen Stadium befinden und ohnehin nicht für jedermann geeignet sind. Dennoch ist davon auszugehen, dass das Interesse an ihnen weiter zunehmen wird, weil die Anforderungen an das Informationsmanagement immer komplexer und zeitkritischer werden – und auch, weil die Nutzer angesichts der Performance- und Skalierbarkeitslimits, wie sie bei relationalen Datenbanken nun einmal vorhanden sind, nach Alternativen suchen.

„Die Beschränkungen relationaler Datenbanken sind einer der Hauptgründe dafür gewesen, die Sache grundsätzlich anders anzugehen“, sagt dazu Noel Yuhanna, Datenbank-Analyst bei Forrester Research Inc. aus dem US-Bundesstaat Massachusetts.

Wie der Name schon sagt, werden die Daten bei Spalten-orientierten Datenbanken (die vor allem für BI-Anwendungen und in der Daten-Analyse eingesetzt werden) vertikal angeordnet, also in Form einer Tabellenspalte; bei konventionellen relationalen Datenbanken erfolgt dies in Zeilenform. Analysten sind der Auffassung, dass die Spalten-Anordnung die Zeit verkürzt, die zum Auslesen der gespeicherten Daten benötigt wird, so dass Abfragen letztlich schneller bearbeitet werden.

Spalten-orientierte Datenbanken als Alternativ-Lösung

Der Einsatz von Spalten-orientierten Datenbanken hat auch dem in Tennessee ansässigen Unternehmen Provisio Inc. ganz neue Wege eröffnet. Provisio steht hinter iTrials, einem Dienst, der es Ärzten und Pharma-Herstellern ermöglicht, die Krankenakten von ca. 70 Millionen. Menschen zu durchsuchen, um damit Kandidaten für klinische Tests zu finden. Dies ist ein sehr datenintensiver Prozess, erklärt Sean Harrison, Chief Security Officer und Senior Information Architect bei Provisio: Üblicherweise wird nach einer Reihe von Personen mit einer bestimmten Krankheit gesucht wird, dann werden die gefundenen Einträge nach bestimmten Kriterien weiter abgeglichen, etwa nach bestimmten Personen oder  Regionen.

Schon vor einiger Zeit war man mit iTrials an die Grenzen der bestehenden Datenbank-Infrastruktur gestoßen. Wie Harrison erläutert, nahmen die Abfragen mehr Zeit in Anspruch als üblich, und es häuften sich die Engpässe bei der Performance. Statt nun mit zusätzlichen Zeilen-orientierten Datenbanken des relationalen Typs gegenzusteuern, entschied sich Provisio für den Umstieg auf ein Spalten-orientiertes Programm in Verbindung mit neuen Servern. „Wir suchten dabei einfach nach einer Lösung, die es uns erlauben würde, die Daten schneller auszulesen“, sagt Harrison.

Die Beschränkungen relationaler Datenbanken sind einer der Hauptgründe dafür gewesen, die Sache grundsätzlich anders anzugehen

Noel Yuhanna, Analyst, Forrester Research Inc.

Aber wie er ebenfalls erwähnt, war eine große Anstrengung vonnöten, um sich auf die neue Kombination von Hardware und Software vorzubereiten. So mussten beispielsweise die hauseigenen Anwendungen vor der Umstellung angepasst werden, und das Rechenzentrum des Unternehmens musste für die neue Hardware auf einen modernen Stand gebracht werden. Insgesamt gesehen sei das Projekt jedoch ein durchschlagender Erfolg gewesen, so Harrison.

Mit der neuen Technologie konnte Provisio die Anzahl der Tabellen in seiner Datenbank von etwa 230.000 auf nur noch 12 reduzieren. Nach Angaben von Harrison benötigen  Abfragen, die früher 10 Minuten in Anspruch nahmen, heute nur noch 30 Sekunden. Die gesteigerte Rechenleistung hat Provisio zudem dazu veranlasst, über neue Einnahme-Quellen nachzudenken. So erwäge man die Einführung eines Dienstes, der es potentiellen Klägern und Rechtsanwälten ermöglichen soll, bei einer juristischen Auseinandersetzung mit medizinischem Hintergrund weitere betroffene Personen ausfindig zu machen, die sich möglicherweise einer Sammelklage anschließen würden.

Forrester-Analyst Yuhanna sieht in Provisio den typischen Fall eines Unternehmens, für das eine Spalten-orientierte Lösung genau das Richtige ist, weil man es mit außerordentlich datenintensiven Aufgaben zu tun hat. „Traditionelle Datenbanken sind eigentlich nicht für derartige Größenordnungen ausgelegt“, so Yuhanna.

NoSQL ist trotz seiner Einfachheit eine der wichtigsten neuen Technologien

Yuhanna und andere Analysten weisen auch auf die wachsende Anzahl von NoSQL-Datenbanken hin. Dies sind DBMS-Lösungen, bei denen die verbreitete SQL-Programmiersprache nicht verwendet wird, oder die sich an anderer Stelle deutlich von den traditionellen relationalen Datenbanken unterscheiden. Einige dieser Lösungen verfolgen einen ganz und gar nicht-relationalen Ansatz, bei anderen wiederum wird nur auf bestimmte relationale Funktionen verzichtet, wie etwa festgelegte Tabellen-Schemata oder Join-Operationen.

NoSQL-Datenbanken kommen nach den Worten von Yuhanna gewöhnlich „ohne großes Drumherum“, was der Grund dafür sei, dass man sich schnell und ohne größeren Kostenaufwand in sie einarbeiten könne. Allerdings weist er darauf hin, dass es bei den NoSQL-Produkten noch viel Raum für Verbesserungen gebe, vor allem bei Benutzerfreundlichkeit und Verwaltung.

„Wie die Dinge im Moment aussehen, gestaltet sich eine Implementierung mit NoSQL noch recht schwierig“, erläutert Yuhanna. „Als Anwendungsentwickler muss man einige Vorkehrungen einbauen, um sicherzustellen, dass die Daten durchweg zugänglich sind und korrekt ausgelesen werden.“

David Menninger, Analyst bei der kalifornischen Ventana Research Inc., weist darauf hin, dass NoSQL-Datenbanken im Allgemeinen für Anwendungsfälle ausgelegt sind, wo es um hohe Performance geht, etwa bei Online-Finanzdienstleistungen oder Spielen. Die Technik eigne sich am besten für „Unternehmen, bei denen die Daten so schnell und in so großer Menge verarbeitet werden müssen, dass sie sich dabei auch wirklich nur den Overhead leisten können, der für die fraglichen Zwecke unumgänglich ist.“

Database as a Service versus Daten-Dienste

Es gibt im Bereich Datenbanken noch zwei weitere Technologien, die dieser Tage in aller Munde sind: Database as a Service sowie Lösungen unter dem Namen „Data Services“. Obwohl diese beiden ähnlich klingen und auch tatsächlich einige Ähnlichkeiten aufweisen, wird von Analysten darauf hingewiesen, dass man die Unterschiede nicht verwischen sollte.

Unter Data Services, auch bekannt als Daten-Virtualisierung oder „Information as a Service“, versteht man die Verwendung eines gemeinsamen virtuellen Speicherorts für Daten verschiedener Systeme, innerhalb einer semantischen oder Middleware-Schicht, auf die Unternehmensanwendungen zugreifen können. Dahinter steckt das Bestreben, fehleranfällige Prozesse der Daten-Replikation in Grenzen zu halten und den Grad der Daten-Integration zu erhöhen, ohne dass die Informationen in einer gemeinsamen Datenbank gespeichert sein müssen.

Im Falle von DaaS dagegen wird die Datenbank selbst in einer virtuellen Umgebung betrieben, wie bei einer Datenbank in der Cloud. Wie Yuhanna dazu anmerkt, können beide Ansätze zu größerer Flexibilität beitragen und den Bedarf an Rechen-Kapazitäten verringern. Denn die Datenbank-Workloads seien dann nicht an spezifische Hardware gebunden und könnten daher effizienter verteilt werden können, ganz nach den verfügbaren Ressourcen.

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Datenbank-Management-Systeme (DBMS)

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close