Fotolia

Berufszweig Data Scientist ist sehr gefragt

Der Bedarf an Data Scientists in den Unternehmen steigt stetig, um die Anforderungen an hochwertige Datenanalysen und Auswertungen zu decken .

Dieser Artikel behandelt

Data Mining

Die Gesellschaft sollte mehr dafür machen, dass vielversprechende Studenten zu einer neuen Generation von Data Scientists heranwachsen. Das forderte Rachel Schutt, Forscherin beim Analytik-Startup Johnson Research Labs aus New York, bei der O'Reilly Strata Conference im Silicon Valley.

Es drohe eine Knappheit bei Datenwissenschaftlern, sagt Schutt – gerade zu einer Zeit, in der die Welt mehr von diesen Vertretern eines noch recht neuen Berufszweiges brauche. „Warum brauchen wir Data Scientists der nächsten Generation? Die kurze Antwort: Weil wir viele und große Probleme haben, die gelöst werden müssen, und weil es nicht genügend Leute mit den richtigen Fähigkeiten dafür gibt“, erklärte Schutt. Nicht immer würden Universitäten hier für die passende Ausbildung sorgen.

Die Data Scientists der Zukunft arbeiten an Lösungen für Probleme in vielen Branchen und Fachgebieten, sagt Schutt, darunter Biotech-Forschung, Informatik, Krankheitsvoraussagen, Regierungsorganisationen, Bildung und Stadtplanung. Ebenso sollen sie dabei helfen, das Leben von Bürgern zu verbessern und Unternehmen und Gesellschaft ein besseres Verständnis für Menschen und ihr Verhalten zu vermitteln.

„Um Probleme mit Daten zu lösen, brauchen Data Scientists eine Mischung aus Kompetenzen aus Informatik, Statistik und Ingenieurswesen“, erläutert Schutt. Doch es gebe hier einen Mangel an neuen Talenten, so dass die künftige Generation gezielt zum Mitmachen bewegt werden müsse.

Schutt war früher als leitende Statistikerin bei Google Research tätig und arbeitet heute parallel als Assistenz-Professorin an der Columbia University. Im Herbstsemester 2012 hielt sie dort die Vorlesung Einführung in die Datenwissenschaft ab. Sie sieht noch einen weiteren Vorteil von Bemühungen, Studenten für diesen Beruf zu begeistern: Sie würden zu einer klareren Definition dessen führen, was Data Scientists eigentlich machen.

Datenwissenschaft muss tiefer verstanden werden – auf eine Weise, dass sie die Bezeichnung Wissenschaft wirklich verdient, so Schutt. Mehr gut ausgebildete Leute dafür zu gewinnen, werde auch dabei helfen, das Aufgabengebiet der Datenwissenschaft auf natürliche und konsequente Weise zu definieren.

Viele Aufgaben für Data Scientists

Eine genaue Definition für den Beruf des Datenwissenschaftlers ist immer noch schwierig festzulegen, weil seine Vertreter in der Praxis eine breite Palette an Aufgaben übernehmen und mit unterschiedlichen Kompetenzen aufwarten – und nicht einmal alle haben Daten oder Wissenschaft in der offiziellen Berufsbezeichnung. Um die aktuelle Lage in der Datenwissenschaft besser zu verstehen, hat sich Schutt an einem Brainstorming über ihre heutigen Tätigkeiten versucht. Das Ergebnis präsentierte sie bei der Konferenz.

Demnach übernehmen Data Scientists oft forschende Datenanalysen, aus denen Visualisierungen für Berichtszwecke hervorgehen. Sie verbringen viel Zeit damit, auf der Grundlage von Daten zu neuen geschäftlichen Erkenntnissen und Kennzahlen zu kommen. Sie unterstützen Unternehmen bei wichtigen datengetriebenen Entscheidungen und sind meist geschickt im Einsatz von Big-Data-Technologien wie Hadoop, MapReduce, Hive und Pig. Oft sind sie Hacker und beherrschen R, Python, Java und andere Programmiersprachen. Sie beantragen Patente und handeln wie Daten-Detektive, um nützliche Informationen zu entdecken.

Data Scientists sagen auf der Grundlage von Beobachtungen aus der Vergangenheit zukünftiges Verhalten voraus. Ihre Erkenntnisse und Vorhersagen halten sie in Berichten, Präsentationen und Tagebüchern fest. Sie sind gut im Erstellen von Algorithmen und statistischen Modellen, und sie wissen, wie sie Maschinen zum Lernen bringen. Sie stellen gute Fragen, und sie haben die Fähigkeit entwickelt, aus Daten Schlüsse zu ziehen. Beim Finden von Korrelationen zwischen Daten haben sie einen guten Instinkt. Sie wissen, wie man Experimente anlegt und analysiert, und sie suchen bei der Beschäftigung mit einem Problem nach Kausalitäten.

Meistens haben Datenwissenschaftler eine Ausbildung in quantitativen Bereichen wie Statistik oder Mathematik, müssen aber auch ihre kommunikativen Fähigkeiten ausbauen, um ihre Erkenntnisse an nicht-technische Kollegen weiterzugeben. Unternehmen, die ein Team aus Data Scientists aufbauen wollen, sollten dabei beachten, dass es sich dabei um sehr unterschiedliche Persönlichkeiten handeln kann.

„Es gibt große Unterschiede bei den Hintergründen von Data Scientists und bei ihren Fähigkeiten“, erklärt Schutt. Kein einzelner Datenwissenschaftler könne alles leisten, was sein Feld mit sich bringt.

Was ein angehender Datenwissenschaftler selbst sagt

Für Ramesh Sampath ist ganz einfach zu verstehen, warum Studenten nur schwierig für die Datenwissenschaft zu begeistern sind. Der Student für Statistik und Data Mining an der Texas A&M University will selbst Data Scientist werden und meldete sich nach dem Vortrag von Schutt zu Wort: Das Berufsbild sei noch nicht klar definiert, und das könne für Neueinsteiger eine Herausforderung sein.

„Wenn man Webentwickler werden will, lernt man JavaScript und ein paar HTML-Tags, und schon ist man fertig“, sagt Sampath. Bei Data Scientists aber sei das nicht so einfach, weil ihre Fähigkeiten so breit angelegt sein müssen.

Anderen Studenten und kommenden Data Scientists rät Sampath davon ab, sofort loszulegen und zu versuchen, riesige Datensätze mit Hadoop und ähnlichen Werkzeugen zu analysieren. Stattdessen sollten sie mit kleinen Datensätzen beginnen, um ein Gefühl dafür zu bekommen, wie unterschiedliche Datenpunkte miteinander zusammenhängen. „Schauen Sie sich einfach neugierig kleine Datensätze an und versuchen Sie, die Daten zu verstehen“, so sein Rat. „Erkunden Sie sie mit Charts und Grafiken. Damit lassen sich hervorragend Beziehungen zwischen Daten erkennen.“

Nachdem man ein besseres Verständnis von seinen Daten gewonnen hat, kann man sich laut Sampath dem nächsten Schritt zuwenden: der Frage, ob sich mit den gefundenen Beziehungen Modelle für Prognosen oder Vorhersagen entwickeln lassen. Jeder angehende Datenwissenschaftler solle sich zudem intensiv darum bemühen, Programmieren zu lernen. „Seien Sie ein Hacker“, sagte Sampath. Die Vorstellung, dass Datenwissenschaftler technisch nicht sehr gut sein müssen, sei nicht mehr aktuell: „Man muss Sachen wirklich selbst erfassen und erforschen können und kann diese Arbeit nicht einfach an jemand anderen abgeben.“

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Erfahren Sie mehr über Data-Mining

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close