Essential Guide

Big Data: Anwendung, Datenschutz und Technologie

Eine umfassende Auswahl von Artikeln, Videos und mehr, die von unseren Redakteuren gewählt wurden.

Mit effizienter Data Governance mehr aus Big Data herausholen

Data Governance kann dabei helfen, das Beste aus einer Big-Data-Umgebung zu holen. Es gibt hierfür allerdings keine einheitliche Erfolgformel.

Big Data lockt mit dem Versprechen des Wettbewerbsvorteils für Unternehmen, indem es Geheimnisse über Kunden und...

andere Schlüsselfaktoren lüftet. Aber es ist auch Vorsicht geboten: Ohne einen geeigneten Data-Governance-Prozess kann der begeisterte Vorstoß bei der Einführung von Big-Data-Projekten eine Reihe von Problemen, wie zum Beispiel irreführende Daten und unvorhergesehene Kosten, auslösen.

Data Governance ist jedoch gerade erst im Begriff, Ordnung in Big-Data-Unternehmen zu bringen. Big Data, worunter man typischerweise eine große Menge von unstrukturierten Daten versteht, ist ein sehr junges Phänomen, das in vielen Organisationen unter dem Radar der IT-Abteilungen Einzug gehalten hat. Daher steckt die Governance von Big-Data-Umgebungen meist noch in den Anfängen. Nach Angaben einiger Daten-Management-Analysten gibt es bisher nur wenige weit verbreitete Rezepte, wie Data Governance effektiv eingesetzt werden kann.

„Big Data ist ein so neues Feld, dass bisher noch keine entsprechenden Governance-Verfahren oder -Richtlinien entwickelt wurden“, erklärt Boris Evelson, Analyst bei Forrester Research. „Zurzeit gibt es mehr Fragen als Antworten.“

Ein grundlegendes Problem sei, dass Big-Data-Pools mehr an Datenerforschung und -ermittlung orientiert sind als an herkömmlichen Business-Intelligence-Berichten und -Analysen, fügt Evelson hinzu. Dadurch entsteht ein Teufelskreis: „Die Daten können nicht verwaltet werden, solange sie nicht modelliert werden. Sie können jedoch erst modelliert werden, wenn sie erforscht wurden.“

Data-Governance-Programme bieten einen Rahmen, um Richtlinien für die Datennutzung und Kontrollen einzuführen, die sicherstellen, dass die Informationen genau, konsistent und zugänglich bleiben. Es ist klar, dass im Verwaltungsprozess von Big Data die Kategorisierung, Modellierung und Zuordnung der Daten bei ihrer Gewinnung und Speicherung eine große Herausforderung darstellen, insbesondere da die meisten dieser Informationen in unstrukturierter Form vorliegen.

„Um sinnvolle Geschäftsinformationen aus Big Data gewinnen zu können, müssen eine ganze Reihe von Aktivitäten ausgeführt werden, wie beispielsweise semantische Datenanalysen, die dann in konzeptionelle Modelle oder Ontologien übertragen werden“, erklärt Malcolm Chisholm, President der Daten-Management-Beratung AskGet. „Und dazu gehört eine ganze Menge Data Governance.“

Auf der Suche nach Hinweisen in Big Data

Die Schwierigkeit besteht darin, dass alles, was den Data-Governance-Prozess für Big Data betrifft, noch neu ist. „Die Gespräche rund um Big Data befinden sich noch in einem sehr unreifen Stadium und die Mehrheit der Daten-Manager, die sich damit befassen, hat nicht wirklich Ahnung“, so Chisholm.

Big Data, wozu auch eine große Menge von strukturierten Transaktionsdaten gehören kann, hat sehr spezifische Eigenschaften. Üblicherweise wird dies im Englischen mit den drei Vs definiert: Volume, Variety und Velocity (Umfang, Vielfalt und Geschwindigkeit). Forrester fügt dieser Definition noch Veränderlichkeit hinzu, während Gartner sie um Komplexität ergänzt.

Hinzu kommt, dass die Daten oft aus externen Quellen stammen und es nicht immer einfach ist, deren Genauigkeit zu überprüfen. Zudem ist die Bedeutung und der Kontext von Textdaten nicht unbedingt offensichtlich. Und in vielen Fällen werden sie in Hadoop-Dateisystemen (HDFS) oder NoSQL-Datenbanken statt in herkömmlichen Data Warehouses gespeichert. In vielen Organisationen gehört eine kollektive Lernkurve für alle Betroffenen zum Umgang mit Big Data: IT-Manager, Programmierer, Datenarchitekten, Datenmodellierer und Data-Governance-Experten.

Zu viel Big Data ist eine Gefahr

Einer der gefährlichsten Fallstricke im Umgang mit der Flut an Big Data und beim Versuch, diese zu verwalten, ist es, die Geschäftsprioritäten aus den Augen zu verlieren, so Rick Sherman, Gründer der Beratungsfirma Athena IT Solutions.

Laut Sherman stammen viele der von Unternehmen gewonnen unstrukturierten Daten aus sozialen Medien und typischerweise ist nur ein kleiner Teil dieser Informationen von signifikantem Wert. „Es wäre ein großer Fehler, wollte man alles in Bezug auf unstrukturierte Daten verwalten und kontrollieren“, erklärt er. Sherman warnt davor, dass Unternehmen dabei leicht Zeit und Ressourcen auf unwichtige Daten verschwenden können.

Auch Danette McGilvray, President von Granite Falls Consulting, vertritt die Ansicht, dass Big Data zum großen Zeitfresser für Daten-Management- und Data-Governance-Teams werden kann, wenn es nicht intelligent und vernünftig gehandhabt wird. „Wir können nur herausfinden, ob es sinn- und wertvoll ist, die Daten zu verwalten, wenn wir wissen, was wir für unser Geschäft benötigen“, sagt McGilvray. „Wenn es um Big Data geht, müssen wir uns das immer noch in Erinnerung rufen.“

Gwen Thomas, Gründerin und President von The Data Governance Institute LLC, einem Beratungs- und Schulungsunternehmen, empfiehlt Data-Governance-Managern, die Big Data in den Griff bekommen wollen, die Beurteilung der Qualität der eingehenden Daten als oberste Priorität festzulegen. Proaktive Qualitätschecks bei den Daten könnten für künftige Projekte eine Menge Zeit und Kummer ersparen, ist Thomas überzeugt.

Zusammenhängende Daten dank Abgleich

Häufig werde auch unterschätzt, so Thomas, wie wichtig es ist, dass die neuen Daten den von der Organisation zur Kategorisierung der Informationen genutzten Referenzdaten zugeordnet werden. Der Abgleich von Big Data mit bestehenden Referenzdaten sei ein sehr wichtiges Detail. „Wenn das nicht richtig gemacht wird, kann es dazu führen, dass die sich aus der Verarbeitung von Big Data ergebenden Informationen irreführend, ungenau oder unvollständig sind.“

Mehr zum Thema Big Data:

Big Data und Cloud Computing mit Akzeptanzproblemen.

Wie man Big Data aus Sicherheitsperspektive angeht.

Big Data für ein industrielles Internet der Dinge einsetzen.

Hadoop 2 bietet für Big-Data-Umgebungen eine bessere Analytics-Verarbeitung.

Die zwei größten Big-Data-Fehler – und wie sie vermieden werden.

Um sicherzustellen, dass die Daten richtig zugeordnet werden, sollte diese Aufgabe einem erfahrenen Datenarchitekten statt einem weniger erfahrenen Datenmodellierer oder jemandem außerhalb der IT übertragen werden, empfiehlt Thomas.

Chisholm erklärte, Data-Governance-Manager sollten produktiven Gesprächen über die anzuwendenden Datenmodelle mit den Programmierern und den Geschäftsanwendern, die oft die Big-Data-Installationen initiieren, Priorität einräumen. Solche Diskussionen sollten jedoch von einem tiefgehenden Verständnis für Hadoop- und NoSQL-Technologien und ihren Unterschieden zu relationalen Datenbanken sowie vom Bewusstsein, dass für die Verwaltung und Governance von Big Data ein gemeinsames Vorgehen nötig ist, ausgehen.

Chisholm zufolge sollten die Unternehmen dafür sorgen, dass Programmierer und Anwender nicht jeweils ihre eigenen Wege gehen und isolierte Ansichten in den Aufbauprozess für Big-Data-Systeme und die nötige Datenmodellierung und Zuordnungsarbeit einbringen. Denn damit könnten sie hohe Kosten für Sanierungen, ungeeignete Installationen, die nicht den erwarteten Geschäftsvorteil erbringen, und verschwendete Investitionen in unnütze Systeme verursachen.

Über den Autor:
Roger du Mars ist freier Publizist und lebt in Redmond, Washington. Seine Artikel wurden in Publikationen wie Time, USA Today und The Boston Globe veröffentlicht. Zuvor war er Büroleiter von Asiaweek und der South China Morning Post in Seoul, Südkorea.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im September 2015 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

0 Kommentare

Älteste Beiträge 

Passwort vergessen?

Kein Problem! Tragen Sie Ihre E-Mail-Adresse unten ein. Wir werden Ihnen eine E-Mail mit Ihrem Passwort schicken.

Ihr Passwort wurde an die folgende E-Mail-Adresse gesendet::

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close