Fotolia

Die Suchmaschine für Analytics: Mit ThoughtSpot Geschäftszahlen analysieren

ThoughtSpot möchte das Google für Geschäftszahlen sein. Das kalifornische Start-up bietet eine In-Memory-basierte Suchmaschine für Analytics-Daten.

Die Analyse von Business-Logik und –Zahlen ist keine Zauberei. Business-Intelligence- und Business-Analytics-Tools gibt es praktisch im Überfluss. Mit sinkenden Preisen bei Storage- und RAM-Technologien lässt sich Big Data aber auch auf Hardwareebene bewältigen.

Ein Problem bleibt bestehen: Die in den Unternehmen anfallenden Daten liegen zum großen Teil ungenutzt herum, da sie entweder unstrukturiert oder für Business-Anwender nicht sichtbar sind. Diesem Problem widmet sich das kalifornische Start-up ThoughtSpot.

Die Idee von ThoughtSpot ist einfach: Die Rohdaten werden in eine In-Memory-Appliance geladen und indexiert. Das Unternehmen hat hierfür eine eigene In-Memory-Datenbank entwickelt. Um zum Beispiel Zusammenhänge bei Geschäftsdaten zu erkennen, bietet ThoughtSpot auf Basis dieser In-Memory-Datenbank eine Suchmaschine, mit der Business-Anwender Geschäftsdaten durchsuchen können.

„Google diente uns bei der Entwicklung unserer Analytics-Suchmaschine als Vorbild“, sagt Scott Holden, CMO bei ThoughtSpot. „Allerdings richten wir uns im Gegensatz zu Google an Geschäftsanwender, die Business-Analytics-Probleme über die Suchmaschine lösen möchten. Die Anwender brauchen für den Einsatz unserer Technologie kein umfassendes Training. Der Einsatz funktioniert nach bekannten Logiken anderere Suchmaschinen wie Google.“

Daten aus verschiedenen Quellen

ThoughtSpot kombiniert für seine Anwendung Daten aus On-Premises- und Cloud-Storage-Quellen, Spreadsheets und Hadoop. Laut ThoughtSpot CMO Holden lässt sich die Technologie auf Milliarden Zeilen skalieren.

Die Rohdaten des Unternehmens werden kontinuierlich gecrawlt. Kommen neue Daten hinzu, werden diese direkt in den Index geladen (Automatic Search Index). Als Einstiegpunkt für die Suche dient eine einfache Suchmaske. Der Anwender gibt ein Stichwort ein und ThoughtSpot zeigt zusammenhängende Stichwörter (unter anderem auf Basis vorheriger Suchanfragen und eines Ranking-Algorithmus) an.

Suchmaschine auf Basis kollektiver Intelligenz

Gleichzeitig werden auf einem Dashboard in Echtzeit die Suchergebnisse angezeigt. Ändert der Anwender seine Suchanfrage oder gibt ein zusätzliches Stichwort ein, ändert sich auch unmittelbar das Suchergebnis. Zusätzlich lassen sich zum Beispiel Geschäftszahlen vergleichen, Gebiete oder Verkaufsregionen einzeln anzeigen und Korrelationen der Kennzahlen darstellen (siehe Abbildung 1).

Das ThoughtSpot Dashboard für die Anzeige von Kennzahlen und Korrelationen.
Abbildung 1: Das ThoughtSpot Dashboard für die Anzeige von Kennzahlen und Korrelationen.

„Unsere Suchmaschine verwendet kollektive Intelligenz, um die Benutzer zu den richtigen Antworten zu führen und wird von einer hoch entwickelten Rechenmaschine angetrieben, die in der Lage ist, Aggregationen von mehreren Terabyte Daten mit geringer Latenz auszuführen“, erläutert Holden. „Komplett ausgestattet mit einer robusten Integration, granularen Sicherheitsregeln und Cluster-Management für eine zuverlässige und massive Skalierung, bietet ThoughtSpot schnelle Antworten für Business-Profis.“

Ein weiteres Feature von ThoughtSpot ist die benutzerdefinierte Anpassung der Suche. Gesuchte Stichworte des eingeloggten Anwenders speichert die Anwendung ab. Sucht der Benutzer zu einem anderen Zeitpunkt nach einer ähnlichen Lösung, beginnt die Suchmaschine damit, bereits verwendete Stichwörter anzuzeigen oder macht Vorschläge für ähnliche Stichwörter (Guided Search Suggestions).

Für die Berechnung der Vorschläge hat ThoughtSpot einen Algorithmus entwickelt, der maschinelles Lernen einsetzt und die in der Vergangenheit von Anwendern gesuchten Probleme berücksichtigt (DataRank).

ThoughtSpot basiert auf fünf Säulen

Die Architektur von ThoughtSpot setzt sich aus fünf Bausteinen zusammen: der relationalen Suchmaschine, einer Visualization Engine, Collaboration, einer In-Memory Calculation Engine und einem Distributed Cluster Manager (siehe Abbildung 2).

Die Architektur von ThoughtSpot im Überblick.
Abbildung 2: Die Architektur von ThoughtSpot im Überblick.

Relationale Suchmaschine: Die Suchmaschine zeigt relevante Vorschläge basierend auf jedem eingegebenen Wort an. Die Suchvorschläge werden über einen Ranking-Algorithmus (DataRank) angezeigt. Hierfür werden zum Beispiel frühere Suchanfragen, Sicherheitsregeln und Eigenschaften der Daten einbezogen. Der sogenannte Search Inspector erläutert die zugrunde liegenden Berechnungen der Suchergebnisse, um diese bei Bedarf prüfen zu können. Die Suche eignet sich zum Beispiel für Formeln, verschachtelte Suchaufträge oder Verbindungen.

Visualization Engine: Die Visualisierung der gesuchten Kennzahlen erfolgt auf einem Dashboard. Zur Auswahl stehen ein Dutzend verschiedene Diagrammtypen. Die einzelnen Diagramme lassen sich per Drag-and-Drop verschieben und im Dashboard anpinnen (Pinboard). Durch einen Klick auf ein Diagramm beziehungsweise Diagrammdetails, kann man sich die Daten im Detail ansehen. Dabei kann man sich in jede Datendimension navigieren.

Collaboration: Die dargestellten Inhalte und Analysen lassen sich mit Gruppen und einzelnen Benutzern teilen. Ein Präsentationsmodus bietet eine Komplettansicht für Diagramme und Pinboards. Möchten Benutzer Diagramme und Kennzahlen bewerten, können sie über eine Kommentarfunktion Nachrichten schreiben. Schließlich können Anwender Warnmeldungen für Daten und geplante Mitteilungen konfigurieren.

In-Memory Calculation Engine: Der Cache der Suchmaschine ist für die Suche, Abfrageverarbeitung und Berechnungen der Analytics-Daten optimiert. Häufige Suchanfragen werden im Cache gespeichert, um eine schnellere Suche zu gewährleisten. Die Engine führt Abfragen und Aggregationen parallel aus, um Ergebnisse in Millisekunden zu liefern. Die Daten werden nach einem intelligenten Datenbankschema und der entsprechenden Tabellengröße verteilt, um eine hohe Verfügbarkeit zu gewährleisten.

Distributed Cluster Manager: Der Cluster Manager soll hochverfügbare und skalierbare Cluster garantieren und ermöglicht hierfür Monitoring und Echtzeit-Warnmeldungen. Die verteilte In-Memory-Datenbank innerhalb der Appliance ist laut ThoughtSpot frei skalierbar. Datenreplikation und automatisches Node Failover sollen vor Ausfällen schützen. Zudem bietet die Appliance automatische Backups und Snapshots für Disaster Recovery. Alle nötigen Schritte lassen sich über ein Dashboard steuern.

Mehr zum Thema Business Analytics:

Wie unterscheiden sich Data Scientists von anderen Analytics-Berufen?

Streaming Data Analytics setzt Projektteams einem erhöhten Echtzeit-Druck aus.

Wie unterscheiden sich Business Intelligence und Predictive Analytics?

SAP Cloud for Analytics bringt Business Intelligence in die Cloud.

Die Kundenzufriedenheit hängt auch von Analytics-Erkenntnissen ab.

Datenintegration und Security

ThoughtSpot stellt Datenbank-Konnektoren für gängige ETL-Plattformen (Extract, Transform, Load) zur Verfügung, erlaubt den Upload von Flat Files (zum Beispiel Excel-Tabellen und CSV-Dateien) und das parallele Laden von Daten. Zu den ETL- und Datenbank-Konnektoren gehören unter anderem native ODBC- und JDBC-Konnektoren.

ThoughtSpot Data Connect erlaubt die Kombination von Cloud-Data-Storage und On-Premise-Daten. Eine Ladefunktion für große Datenmengen erlaubt das Laden von mehreren Terabyte Daten pro Stunde. Schließlich lassen sich erstellte Pinboards, Diagramme und Daten über iFrames direkt in eine App oder eine Website einbetten.

Für die Absicherung der Daten bietet ThoughtSpot verschiedene Optionen an. Um die Tabellen abzusichern, lässt sich der Nutzerzugriff bis auf einzelne Zellen benutzerdefiniert konfigurieren. Die Anwendung bietet außerdem native LDAP-Unterstützung für Directory-Services, einschließlich Active Directory, SAML-Integration und unterstützt den Einsatz von Enterprise Single-Sign-On-Software.

ThoughtSpot ist in zwei Versionen verfügbar. Die Enterprise-Version bietet alle aufgezählten Funktionen. Die Version Extended Enterprise unterstützt darüber hinaus zusätzliche APIs und unbegrenzte Gruppenkonfigurationen. Beide Versionen lassen sich sowohl beim Speichervolumen als auch Benutzern frei skalieren. Eine kostenlose Testversion ist aktuell nicht verfügbar, soll aber für einen begrenzten Einsatz im laufenden Jahr veröffentlicht werden. Für detaillierte Preisinformationen sollten Interessenten ThoughtSpot kontaktieren.

Folgendes Video zeigt eine kurze Demo der ThoughtSpot-Funktionen:

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Artikel wurde zuletzt im März 2017 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Business-Software

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close