echiechi - Fotolia

Wie Big Data Analytics Tools Unternehmen helfen können

Big Data Analytics ist ein Trend, dem viele Unternehmen nacheifern. Vor dem Tool-Kauf sollten diese sich jedoch die Softwarelandschaft genau anschauen.

Dieser Artikel behandelt

BI-Management

Der Analyseprozess, einschließlich der Bereitstellung und Nutzung von Big Data Analytics Tools, kann Unternehmen helfen, die betriebliche Effizienz zu steigern, neue Umsätze zu generieren und Wettbewerbsvorteile gegenüber Mitbewerbern zu erlangen. Es gibt jedoch verschiedene Arten von Analyseanwendungen, die es zu berücksichtigen gilt.

Deskriptive Analysen konzentrieren sich zum Beispiel auf die Beschreibung von Ereignissen, die bereits geschehen sind, und auf die Ursachenforschung. Die deskriptive Analytik, die nach wie vor den Löwenanteil der Analysen ausmacht, ist typischerweise abhängig von der grundlegenden Abfrage, dem Reporting und der Visualisierung historischer Daten.

Alternativ kann eine komplexere prädiktive und präskriptive Modellierung Unternehmen helfen, Geschäftsmöglichkeiten zu antizipieren und Entscheidungen zu treffen, die sich auf ihre Gewinne auswirken, zum Beispiel in Bereichen wie Marketing-Kampagnen, Reduzierung der Kundenabwanderung und der Vermeidung von Anlagenausfällen.

Mit Predictive Analytics werden historische Datensätze auf Muster analysiert, die auf zukünftige Situationen und Verhaltensweisen hindeuten, während Prescriptive Analytics Ergebnisse von Predictive Analytics zusammenfasst, um Maßnahmen vorzuschlagen, wie man am besten von den vorhergesagten Szenarien profitiert.

In vielen Umgebungen haben die Anforderungen an die Verarbeitung und Datenspeicherung fortschrittlicher Analytics-Anwendungen ihre Akzeptanz vermindert – doch diese Hürden fallen allmählich. Die zunehmende Verfügbarkeit von Big-Data-Plattformen und -Tools hat Umgebungen ermöglicht, in denen prädiktive und präskriptive Analyseanwendungen skalierbar sind, um große Datenmengen aus einer Vielzahl von Quellen verarbeiten zu können.

Was bedeutet Big Data Analytics?

Im Wesentlichen handelt es sich bei den Tools für Big Data Analytics um Softwareprodukte, die prädiktive und präskriptive Analyseanwendungen unterstützen und die auf Big-Data-Verarbeitungsplattformen ausgeführt werden – in der Regel parallele Verarbeitungssysteme, die auf Clustern von Standardservern, skalierbaren verteilten Speichersystemen und Technologien wie Hadoop und NoSQL-Datenbanken basieren. Die Tools sind so konzipiert, dass Benutzer große Datenmengen schnell analysieren können – häufig in einem Echtzeitfenster.

Darüber hinaus bieten umfangreiche Big Data Analytics Tools den Rahmen für die Verwendung von Data-Mining-Techniken, um Daten zu analysieren, Muster zu entdecken, analytische Modelle vorzuschlagen, identifizierte Muster zu erkennen und darauf zu reagieren, und die Performance von Geschäftsprozessen durch Einbettung der analytischen Modelle in die entsprechenden operativen Anwendungen zu verbessern.

Auf diese Weise können zum Beispiel riesige Mengen Lieferdaten, Verkehrsdaten, Wetterdaten und historische Leistungsdaten über Lieferanten analysiert werden, um ein Modell für eine optimale Auswahl von Spediteuren in geografischen Regionen zu entwickeln, welches die Risiken von verspäteter Lieferung oder beschädigten Gütern vermindert.

Big Data Analytics Tools können eine Vielzahl von Datentypen aufnehmen: strukturierte Daten mit definierten und konsistenten Feldern, zum Beispiel in relationalen Datenbanken gespeicherte Transaktionsdaten; halbstrukturierte Daten, zum Beispiel Webserver- oder Anwendungs-Protokolldateien; und unstrukturierte Daten, zum Beispiel Textdateien, Dokumente, E-Mails, Textnachrichten und Social-Media-Posts.

Leistungsstarke Analytik: Big Data und Advanced Analytics Tools

Eine Google-Suche nach Big Data Analytics fördert eine lange Liste von Anbietern zu Tage. Viele dieser Anbieter stellen Big-Data-Plattformen und Tools bereit, die den Analyseprozess unterstützen – zum Beispiel Datenintegration, Datenaufbereitung und andere Arten des Daten-Managements.

Wir konzentrieren uns auf Tools, die folgende Kriterien erfüllen:

  • Sie stellen dem Analysten fortschrittliche Analysealgorithmen und -modelle zur Verfügung.
  • Sie sind so konzipiert, dass sie auf Big-Data-Plattformen wie Hadoop oder speziellen leistungsfähigen Analysesystemen ausgeführt werden können.
  • Sie lassen sich leicht anpassen, um strukturierte und unstrukturierte Daten aus mehreren Quellen zu verwenden.
  • Ihre Performance ist skalierbar, wenn mehr Daten in analytische Modelle eingearbeitet werden.
  • Ihre analytischen Modelle können mit Visualisierungs- und Präsentationswerkzeugen integriert werden oder sind bereits integriert.
  • Sie können problemlos in andere Technologien integriert werden.

Darüber hinaus müssen die Tools wesentliche Merkmale sowie integrierte Algorithmen und Methoden enthalten, die typische Data-Mining-Techniken unterstützen, einschließlich:

  • Clustering und Segmentierung, was eine große Sammlung von Entitäten in kleinere Gruppen unterteilt, die einige (potentiell unvorhergesehene) Ähnlichkeiten aufweisen. Ein Beispiel ist die Analyse einer Ansammlung von Kunden, um kleinere Segmente für gezieltes Marketing zu differenzieren.
  • Klassifikation, das heißt ein Prozess zur Gliederung von Daten in vordefinierte Klassen auf Grundlage von Attributen, die entweder von einem Analysten vorher ausgewählt oder als Ergebnis eines Cluster-Modells identifiziert werden. Ein Beispiel ist das Segmentierungsmodell, mit dem sich ermitteln lässt, in welches Segment ein neuer Kunde einzuordnen ist.
  • Regression, die verwendet wird, um Beziehungen zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen zu entdecken und um festzustellen, wie sich die Werte der abhängigen Variablen im Verhältnis zu den Werten der unabhängigen Variablen ändern. Ein Beispiel ist die Vorhersage des zukünftigen Werts einer Immobilie anhand der geografischen Lage, des Durchschnittseinkommens, der durchschnittlichen Temperatur und der Quadratmeterzahl.
  • Assoziations- und Itemset Mining, das nach statistisch relevanten Beziehungen zwischen Variablen in einem großen Datensatz sucht. Dies kann zum Beispiel dazu beitragen, dass Call-Center-Mitarbeiter direkt auf Grundlage des Kundensegments, der Dauer der Geschäftsbeziehung und der Art der Beschwerde spezifische Anreize anbieten können.
  • Ähnlichkeit und Korrelation, was verwendet wird, um ungerichtete Clustering-Algorithmen mit Information zu versorgen. Similarity-Scoring-Algorithmen können verwendet werden, um die Ähnlichkeit von Entitäten in einem Kandidaten-Cluster zu bestimmen.
  • Neuronale Netzwerke, die in ungerichteten Analysen für maschinelles Lernen auf Basis adaptiver Gewichtung und Approximation eingesetzt werden.

Dies ist nur ein Teil der für prädiktive und präskriptive Analytik verwendeten Analysearten. Darüber hinaus werden verschiedene Anbieter wahrscheinlich eine Vielzahl von Algorithmen zur Verfügung stellen, die jede der verschiedenen Methoden unterstützen.

Der Advanced-Analytics-Markt

Der Markt für Advanced Analytics Tools hat sich im Laufe der Zeit weiterentwickelt, und die verfügbaren Tools variieren je nach Reifegrad und folglich auch in Bezug auf Leistungsfähigkeit und Benutzerfreundlichkeit. So gibt es zum Beispiel Tools mit relativ langer Historie von einigen großen Anbietern wie IBM, Oracle und SAS. Andere große Anbieter haben Unternehmen erworben, deren Tools eine jüngere Geschichte aufweisen, zum Beispiel Microsoft, Dell, Teradata und SAP.

Eine Reihe kleinerer Unternehmen bietet ebenfalls Big Data Analytics Tools an, darunter Angoss, Predixion, Alteryx, Alpine Data Labs, Pentaho, KNIME und RapidMiner. In einigen Fällen haben Unternehmen eigene Algorithmen entwickelt. Andere haben die Open-Source-Statistiksprache R angepasst und stellen prädiktive und präskriptive Modellierungsfunktionen unter Verwendung der R-Funktionen zur Verfügung oder verwenden die Software aus dem Open-Source-Projekt Weka.

Eine dritte Kategorie sind Produkte, die als Open-Source-Technologien verfügbar sind. Beispiele hierfür sind die zuvor erwähnte Sprache R, die Mahout-Software-Distribution, die Teil des Hadoop-Stacks ist, und Weka.

In einigen dieser Fälle (insbesondere bei den großen Anbietern) werden die Big Data Analytics Tools in eine größere Big Data Enterprise Suite integriert. Andere Anbieter verkaufen ihre Tools dagegen als eigenständige Produkte. Bei letzterem ist es die Aufgabe des Kunden, die Big-Data-Plattform selbstständig zu integrieren.

Die meisten Tools verfügen über eine grafische Benutzeroberfläche zur Steuerung der Analyseprozesse (Data Mining/Discovery Analysis, Evaluierung und Bewertung von Modellen, Integration in betriebliche Umgebungen). In den meisten Fällen stellen Anbieter Leitlinien und Services zur Verfügung, um den Kunden zu helfen.

Wer setzt Big Data und Advanced Analytics Tools ein?

Während in einigen Organisationen einzelne Mitarbeiter neue prädiktive Modelle erforschen und entwickeln, streben andere danach, diese Modelle in ihre Geschäftsprozesse einzubetten. Wieder andere möchten die Gesamtauswirkung verstehen, die diese Tools auf das Geschäft haben.

Mit anderen Worten: Unternehmen, die Big Data analysieren möchten, müssen eine Vielzahl von Anwendertypen berücksichtigen, zum Beispiel:

  • Data Scientists, die komplexe Datentypen analysieren und mit der Art und Weise vertraut sind, wie die zugrunde liegenden Modelle entworfen und implementiert werden, um inhärente Abhängigkeiten oder Verzerrungen zu bewerten.
  • Business-Analysten, die eher Gelegenheitsanwender sind und die Tools zur proaktiven Datenermittlung oder Visualisierung vorhandener Informationen sowie einige prädiktive Analysen nutzen möchte.
  • Geschäftsführer, die die Modelle und Schlussfolgerungen verstehen möchten.
  • IT-Entwickler, die alle vorherigen Kategorien von Benutzern unterstützen.

Alle diese Rollen würden typischerweise im Modellentwicklungslebenszyklus zusammenarbeiten. Der Data Scientist unterzieht einen Big-Data-Satz ungerichteten Analysen und sucht nach Mustern, die für das Business von Interesse sein könnten. Nachdem der Business Analyst die Funktionsweise der Modelle überprüft und bewertet hat, ob sich die entdeckten Modelle beziehungsweise Muster auf das Geschäft positiv auswirken, werden die Manager und IT-Teams hinzugezogen, um die Modelle in die Geschäftsprozesse einzubetten beziehungsweise zu integrieren oder neue Prozesse um die Modelle herum entwickeln.

Aus Marktperspektive ist jedoch interessant, die Arten von Unternehmen zu betrachten, die sich der Big-Data-Analyse verschrieben haben. Viele der frühen Nutzer von Big-Data-Technologie waren Internetunternehmen (zum Beispiel Google, Yahoo, Facebook, LinkedIn und Netflix) oder Anbieter von Analysedienstleistungen. Jedes dieser Unternehmen stützt sich auf operative und analytische Anwendungen, die schnell fließende Datenströme zur Aufnahme, Verarbeitung und Analyse erfordern und anschließend die Ergebnisse zurückführen, um kontinuierlich die Leistung zu verbessern.

Da der Datenhunger bei Unternehmen in den Mainstream-Branchen immer stärker zunimmt, hat sich Big Data Analytics einen Platz in einer breiteren Anzahl von Unternehmen erobert. In der Vergangenheit konnten die Kosten für eine Big-Data-Plattform lediglich in großen Unternehmen gerechtfertigt werden. Allerdings hat die Verfügbarkeit von gehosteten Big-Data-Plattformen (wie Amazon Web Services) und die Möglichkeit, Big-Data-Plattformen wie Hadoop On-Premises ohne große Investitionen instanziieren zu können, den Einstieg erleichtert. Offene Datensätze und der Zugang zu Social-Media-Kanälen stellen darüber hinaus den Rohstoff für Big-Data-Analysen bereit, wenn sie mit internen Datensätzen vermischt werden.

Größere Unternehmen entscheiden sich wahrscheinlich immer noch für High-End-Tools zur Analyse großer Datenmengen, aber kostengünstigere Alternativen auf kosteneffektiven Plattformen ermöglichen es kleinen und mittleren Unternehmen, Big Data Analytics zu evaluieren und die gewünschten Ergebnisse zu erzielen.

Nachdem wir die verschiedenen Werkzeugtypen und deren Einsatzmöglichkeiten untersucht haben, geht es nun darum, herauszufinden, wie diese Tools einem Unternehmen zugutekommen können. Wenn man sich die verschiedenen Anwendungsfälle für Big Data Analytics anschaut, wird man erkennen, wo eine generelle Big-Data-Analytics-Funktion genutzt werden kann, um Werte zu schaffen und zu steigern.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Kostenloser E-Guide: Tipps und Tricks für Big Data Analytics.

Big Data und Digitalisierung: Warum Algorithmen so entscheidend sind.

Fünf Wege zur Vermeidung üblicher Fallstricke in Big-Data-Analytics-Projekten.

Artikel wurde zuletzt im Oktober 2017 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über BI-Management

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close