Sergey Nivens - Fotolia

So maximiert man die Verfügbarkeit von Oracle EPM-Systemen

Es gibt viele mögliche Gründe für den Ausfall des Oracle Enterprise-Performance-Management-Systems. Verschiedene Tipps zum Schutz vor dem Worst Case.

Unternehmen dehnen zunehmend die Implementierung von Technologien für das Enterprise Performance Management (EPM) auf eine breitere Benutzerbasis aus. Und das aus gutem Grund: EPM-Anwendungen helfen Mitarbeitern, Finanzdaten unternehmensweit zu teilen und Analytics auf die Business Performance zu übertragen – und das nicht nur in der Finanzabteilung. Solche Einsatzmöglichkeiten machen diese Systeme für Unternehmen wichtiger denn je.

Dieser Artikel gibt Tipps zur Implementierung hochverfügbarer und fehlertoleranter Oracle EPM-Systeme. Wenn man diese Tipps beachtet, schützt man sich vor Problemen, die zu kostspieligen Ausfallzeiten führen und sorgt dafür, dass aufgetretene Ausfälle der Systeme sich schnell wiederherstellen lassen.

Der erste Schritt für die Bereitstellung eines hochverfügbaren EPM-Systems ist, festzustellen, welche Service-Levels benötigt werden. Um dies herauszufinden, sollte man die Wahrscheinlichkeit von verschiedenen Arten von Ausfällen einschätzen und sich überlegen, welche der daraus resultierenden möglichen Ausfallzeiten und Datenverluste das Unternehmen toleriert.

Das Ausfüllen einer einfachen Matrix kann helfen, die Service-Level-Anforderungen zu dokumentieren. Zum Beispiel lässt sich eine Matrix wie die folgende mit zwei Service-Level-Metriken für spezifische Ausfälle erstellen: Erstens, das Recovery Point Objective (RPO), das festlegt, wie viel Datenverlust in Kauf genommen werden kann. Und zweitens das Recovery Time Objective (RTO), das die tolerierte Dauer festlegt, die ein Business-Prozess oder System ausfallen darf.

Beispiel einer Matrix zur Bestimmtung der Oracle EPM Service-Level-Anforderungen
Abbildung 1: Beispiel einer Matrix zur Bestimmtung der Oracle EPM Service-Level-Anforderungen

Im Folgenden betrachten wir zunächst einige verbreitete Fehlerarten etwas näher. Anschließend erläutern wir die Schritte, die man ausführen sollten, um diese Ausfälle zu vermeiden. Zumindest sollten damit die Auswirkungen auf das Oracle EPM-System minimiert werden, so dass sich die Service-Level-Anforderungen erfüllen lassen.

Datenkorruption. Die meisten Probleme in EPM-Systemen sind auf menschliche Fehler zurückzuführen. Das bedeutet letztendlich, dass Datenkorruption die häufigste Fehlerart ist. Dieses Problem lässt sich grundsätzlich mit periodischen Backups bekämpfen.

Die Hyperion-Produktlinie ist der Eckpfeiler der EPM-Suite von Oracle. Das Lifecycle-Management-Programm in Hyperion kann skriptgesteuert und so geplant werden, dass Sicherheitseinstellungen, Anwendungen, Daten, Berichten und andere EPM-Artefakten automatisch und periodisch exportiert und gesichert werden. Scripte müssen beibehalten und überwacht werden, da sie höchstwahrscheinlich kontinuierlich gepflegt werden müssen, um das Anwendungsprofil anzupassen, wenn sich das System im Laufe der Zeit ändert.

Wichtig ist es auch, Sicherungen des EPM-Servers selbst zu übernehmen, falls das Betriebssystem-Layer beschädigt ist. Schließlich ist auch ein Backup des relationalen Datenbank-Verzeichnisse erforderlich, falls die dort abgelegten Daten beschädigt werden sollten.

Auch das Timing ist wichtig: Datenbank, Betriebssystem und Dateisystem müssen möglicherweise zum gleichen Zeitpunkt wiederhergestellt werden. Für die Backup- und Wiederherstellungsplanung muss man deshalb System-, Datenbank- und Hyperion-Administratoren koordinieren, um für die gesamte Plattform Konsistenz zu gewährleisten.

Hardwarefehler. Ausfälle der Serverhardware sind heutzutage weniger häufig als früher, aber sie sind immer noch möglich. Eine übliche Strategie zur Verhinderung von Ausfällen auf Grund von Hardwarefehlern ist die Verwendung von Server-Clustern. Diese verlagern die Dienste für den Fall, dass ein System Offline geht, auf ein Ersatzsystem.

Verfügbar sind zwei Arten von Clustern: aktiv-aktiv Cluster und aktiv-passiv Cluster. In aktiv-aktiven Clustern sind die Server so konfiguriert, dass EPM-Workloads auf mehrere Server verteilt werden, die alle dieselben Dienste gleichzeitig ausführen. Dies ist nützlich für die Lastverteilung. Üblicherweise wird ein physischer Load Balancer als einziger Einstiegspunkt für das Cluster verwendet – er verteilt die Anforderungen für die Verarbeitung von Ressourcen über die Server. Der Vorteil bei einem Ausfall: Wenn ein Server ausfällt, sind die verbleibenden Server weiter in Betrieb. Aktiv-aktiv Cluster werden häufig im Web-Layer von Oracle EPM-Produkten verwendet.

In einigen Fällen werden jedoch mehrere aktiv-aktiv Load-Balancing-Komponenten entweder nicht unterstützt oder können in der Oracle EPM-Suite nicht eingerichtet werden. Für diese Situationen ist eine aktiv-passiv Anordnung erforderlich.

In einem aktiv-passiven Cluster ist nur ein Server zu einem bestimmten Zeitpunkt in Betrieb. Wenn er ausfällt, erkennt ein Standby-Server den Fehler und startet die Dienste auf seinem System, um den Betrieb weiter fortzusetzen. Aktiv-passive Cluster sind üblich für Systeme in der EPM-Datenschicht, wie bei der mehrdimensionalne Datenbank Essbase, die viele Hyperion-Implementierungen unterstützt.

Ausfall des Rechenzentrums. Mögliche Ausfälle des ganzen Rechenzentrums können mit mehreren Maßnahmen begegnet werden, die abhängig von der vorhandenen Technologie sind. Eine Option ist, häufiger Lifecycle-Management-Exporte von EPM-Artefakten zu einer Disaster-Recovery-Instanz in einem anderen Rechenzentrum zu machen. Dieser Prozess kann kompliziert sein und erfordert viel Skripting, Automatisierung und Wartung. Aber es ist ein gängiger Ansatz für Benutzer, die über keine teure Datenreplikationstechnologie verfügen und eine höhere Toleranz gegenüber Ausfallzeiten haben.

Für Benutzer mit geringerer Toleranz gegenüber Ausfallzeiten kann Replikationssoftware verwendet werden. Diese synchronisiert in Echtzeit Systeme von einem Rechenzentrum mit denen eines anderen Data Centers. Das bedeutet, dass im Falle eines Rechenzentrumsausfalls kein Datenverlust auftritt. Der Nachteil ist, dass die Software recht teuer ist.

Fehlervermeidung durch Qualitätssicherung

Die vielleicht beste Möglichkeit, Ausfallzeiten zu bekämpfen, besteht darin, diese von vornherein zu verhindern. Dazu sollten strenge Qualitätskontrollen festgelegt werden. Dabei definiert man für Entwickler, Tester und andere, die an Ihrem EPM-Projekt beteiligt sind, klar definierte Rollen und Verantwortlichkeiten.

Abgesehen davon stellen Qualitätskontrollen auch einen Rahmen zur Verfügung, der die Prüfung aller Entwicklungsobjekte erzwingt, bevor sie in die Produktion gehen. Darüber hinaus sind sie die Basis für Workflows und Genehmigungen, Audit Trails, Back-out-Verfahren und Pass/Fail-Faktoren.

Viel Sorgfalt sollte auch für die Wartung von Hyperion aufgewendet werden. Genau wie bei jedem anderen System gibt es auch hier Dinge, die täglich, wöchentlich und monatlich durchgeführt werden müssen, damit das Oracle EPM-System richtig abgestimmt am Laufen bleibt. Zu diesen Aufgaben gehören Log-Rotation, Dateisystembereinigung, Systemüberwachung, Disaster-Recovery-Tests und Performance Monitoring.

Überwachung und Sicherheit des EPM-Systems

Natürlich können nicht alle Ausfälle von Vorkehrungs- und Schutzmaßnahmen verhindert werden. Für diesen Fall der Fälle muss geplant und sichergestellt sein, dass man Verfahren hat, um Ausfälle und Probleme schnell erkennen und möglichst sofort darauf reagieren zu können.

Die Fehlererkennung ist der Schlüssel zur Minimierung von Ausfallzeiten. Für die Überwachung von EPM-Systemen stehen viele kommerzielle und kostenlose Softwarepakete zur Verfügung. Diese Pakete können einen Ausfall erkennen und die entsprechenden Personen sofort alarmieren, so dass der Fehler gleich behoben werden kann. Das geht im Idealfall so schnell, dass manche Endbenutzer das aufgetretene Problem gar nicht mitbekommen.

Mehr zum Thema Oracle-Software:

Big Data Discovery kann Oracle wieder in den Gartner BI Magic Quadrant hieven.

Die Oracle ERP Cloud ist auf Unternehmen aller Größen und Branchen zugeschnitten.

Oracle JET bietet Entwicklern verschiedene Tools für die Anwendungsentwicklung.

Oracle Hyperion EPM mit integrierten Funktionen kostengünstig testen.

Oracle OpenWorld 2016: Viel Marketing – wenig Substanz.

Darüber hinaus können Warnungen abgesetzt werden, um Ereignisse zu markieren, die gefährlich nahe dran sind, zu Ausfällen zu führen. Warnungen können verhindern, dass ein potentenieller Ausfall zu einem tatsächlichen Ausfall führt. Diese Warnungen können zum Beispiel ausgelöst werden bei langsamen Reaktionszeiten, nahezu vollem Speicherplatz, Ausfällen einzelner Services, Fehler in System-Logs und bei CPU- oder Speicherauslastung nahe am Maximum.

Sicherheit hat für CIOs in jeder Branche oberste Priorität – so sollte es zumindest sein. Oracle EPM-Systeme speichern häufig sensible und vertrauliche Finanzdaten. Sicherheitsprozesse und -werkzeuge sollten deshalb auf allen Ebenen eines Systems implementiert werden. Zu diesen Prozessen gehören die Passwortstärke und Rotationsrichtlinien, die Härtung des Betriebssystems, Netzwerk-Firewalls, Abgrenzung von Aufgaben, kontinuierliches Intrusion Detection Monitoring und die Verschlüsselung von Daten – sowohl bei der lokalen Nutzung als auch bei der Übertragung.

Wenn das alles nach sehr viel klingt – gut, dann ist es so. Und natürlich fallen für die Vorkehrungen auch Kosten an. Allerdings müssen auch Kosten kalkuliert werden, falls man keine Maßnahmen trifft. In den meisten Fällen sind die Kosten für den Schutz von Geschäftsdaten, Hardware und Rechenzentrumseinrichtungen deutlich geringer als die Kosten, die entstehen, wenn das EPM-System ausfällt und möglicherweise Daten verloren gehen. Nichtstun kann sich als teuer erweisen.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im Februar 2017 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Oracle-Management

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close