Definition

Apache Hadoop 2

Diese Definition ist Teil unseres Essential Guides: Big Data: Anwendung, Datenschutz und Technologie

Apache Hadoop 2 unterstützt über die Einführung von YARN (Yet Another Resource Negotiator) die Ausführung von Anwendungen ohne Stapelverarbeitung. YARN ist ein neu gestalteter Ressourcen-Manager, der die Abhängigkeit vom MapReduce-Programmiermodell beseitigt. YARN lagert Ressourcen-Management und Job-Planung in eine separate Schicht unterhalb der Datenverarbeitungsschicht aus, so dass Hadoop 2 eine Vielzahl von Anwendungen ausführen kann.

Durch diese Änderungen lässt sich das Framework für eine deutlich größere Anzahl von Big-Data-Analytics- und andere Enterprise-Anwendungen einsetzen. Es ist mit Hadoop 2 nun zum Beispiel möglich Ereignisverarbeitungs-, Streaming-, Echtzeit- und operative Applikationen auszuführen. Die Fähigkeit auch andere Frameworks als MapReduce zu unterstützen, bedeutet außerdem, dass Hadoop als Plattform für eine breite Palette von analytischen Anwendungen verwendet werden kann.

Hadoop 2 enthält daneben neue Funktionen, die die Systemverfügbarkeit und Skalierbarkeit verbessern. Zum Beispiel wurde die Funktion Hadoop Distributed File System (HDFS) High Availability (HA) eingeführt, welche die NameNode-Architektur in Hadoop vereint. In der vorherigen Version hatten Hadoop-Cluster einen NameNode, der einen Verzeichnisbaum von HDFS-Dateien überwachte und überprüfte, wo die Daten in einem Cluster gespeichert sind.

Das High-Availability-Schema in Hadoop 2 erlaubt es Anwendern, ein Cluster mit redundanten NameNodes zu konfigurieren. Auf diese Weise verringert man die Wahrscheinlichkeit, dass ein einzelner NameNode zum Single Point of Failure (SPoF) innerhalb eines Clusters wird.  Die neuen HDFS Föderationen ermöglichen es, Cluster horizontal mit mehreren NameNodes zu bauen, die unabhängig voneinander arbeiten, aber einen gemeinsamen Datenspeicherpool teilen. Dies bietet eine bessere Rechenleistungsskalierung als in der ersten Iteration von Apache Hadoop.

Hadoop 2 unterstützt schließlich Microsoft Windows und bietet Snapshot-Funktionen, die schreibgeschützte Point-in-Time-Kopien eines Dateisystems für Datensicherung und Disaster Recovery (DR) zur Verfügung stellen. Darüber hinaus bietet das Framework alle wichtigen binären Kompatibilitäten mit existierenden MapReduce-Anwendungen, die ursprünglich für die ersten Releases von Hadoop erstellt wurden.

Diese Definition wurde zuletzt im Oktober 2015 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

Extensions de fichiers et formats de fichiers

Motorisé par:

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close