F

Tests für Data Warehouses

Data Warehouse stellen eine Kombination aus einer großen Datenbank und großen Anwendungen dar. Sie müssen entsprechend getestet werden.

Können Sie mir irgendwelche Informationen über das Testen von Data Warehouses geben?

Das ist eine hervorragende Frage, denn wie wir alle wissen, sind Tests für jedes Entwicklungsprojekt entscheidend. Je größer das Projekt, desto wichtiger werden die Tests – und Data Warehouses sind meistens sehr große Projekte.

Allerdings lautet meine Antwort „Nein, ich habe eigentlich keine Informationen speziell zu Tests bei Data Warehouses.“ Darauf könnten wiederum Sie antworten: „Was!? Tests sind wichtig, aber Sie wissen nichts darüber!? Und Sie wollen ein Experte sein!?“

Gemach. Ich habe nicht gesagt, dass ich nichts darüber weiß, ich weiß nur nichts Spezifisches. Der Grund dafür: Bei der Auslegung eines Data Warehouse geht man ganz anders vor als bei anderen Anwendungen, aber das Testen ist in beiden Fällen sehr ähnlich. Also können Sie alles, was Sie über Tests mit Software (und Hardware) wissen, auch auf Data Warehouses anwenden.

Nehmen wir ein kleines konkretes Beispiel, etwa eine Routine für Extract, Transform and Load (ETL). Sie schreiben sie und testen sie dann. Sie schicken der Routine einen kleinen Block typischer Daten, dann einen größeren, dann einen riesigen, dann einen viel größeren, als man im normalen Betrieb wohl sehen würde. Sie messen den Zeitaufwand für alle Durchläufe und tragen ihn in einer Grafik zur Skalierung ein. Sie achten auf Fehler bei den Ergebnissen.

Dann geben Sie einen Daten-Block ein, bei dem alle Rand- und Grenz-Effekte auftreten können. Was passiert, wenn ein Wert, bei dem es sich um eine positive Ganzzahl handeln müsste, Null wird oder negativ oder eine Kommastelle bekommt? Was passiert, wenn der Wert 255 oder 1000 oder 1 Million oder 1023 oder 1024 oder 65.535 beträgt?

Und so weiter und so weiter. Mir ist klar, dass ich Ihnen hier nichts Neues erzähle – all das gehört zu Standard-Testes dazu. Aber das ist genau der Punkt: Ein Data Warehouse ist schlicht eine Mischung aus einer großen Datenbank und großen Anwendungen. Genau so können wir es auch testen.

Ihre Frage ist trotzdem hervorragend, weil sie die Tatsache klar macht, dass wir unsere Data Warehouses sehr streng testen müssen. Die gute Nachricht dabei: Die meisten der dafür nötigen Kompetenzen sind intern bereits vorhanden und lassen sich auch für das Data Warehouse nutzen. Aus diesem Grund beschäftigen sich auch die Standard-Lehrbücher dazu nicht sehr intensiv mit Tests. Im Kimball-Klassiker „The Data Warehouse Lifecycle Toolkit“ zum Beispiel gibt es nur eine Seite darüber, und die steht im Kapitel „Aufbau von Anwendungen für Endnutzer“.

Und übrigens: Sie glauben, dass Binär-Grenzwerte wie 1024 bei moderner Software keine Rolle mehr spielen? Dann lesen Sie mal die aktuellen Berichte über das Problem von Excel 2007 mit dem Wert 65.535...

Artikel wurde zuletzt im Januar 2008 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Data Warehouse

0 Kommentare

Älteste Beiträge 

Passwort vergessen?

Kein Problem! Tragen Sie Ihre E-Mail-Adresse unten ein. Wir werden Ihnen eine E-Mail mit Ihrem Passwort schicken.

Ihr Passwort wurde an die folgende E-Mail-Adresse gesendet::

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close