Zum Hauptinhalt springen
Die Zukunft der Data Science

Die Zukunft der Data Science

Warum Unternehmen an Data Science nicht mehr vorbeikommen

Warum Unternehmen an Data Science nicht mehr vorbeikommen
Z-Logo-Black.jpg
Firma: HP Deutschland GmbH
Sprache: Deutsch
Größe: 1 Seite
Erscheinungsjahr: 2021
Besonderheit: registrierungsfrei

Das Datenwachstum ist ungebrochen. Laut dem „Worldwide Global DataSphere Forecast“ des Marktforschungsunternehmens IDC steigt die Menge an weltweit erzeugten, erfassten, replizierten und konsumierten Daten bis 2023 auf 103 Zettabyte. Um diese Menge an Daten auf Festplatten zu speichern, würde man mehr als 10 Milliarden 10-TB-Harddisks benötigen!

Für Unternehmen liegt die Herausforderung vor allem darin, in dieser Flut an Daten die wirklich wichtigen Informationen zu finden, sie auszuwerten und aus den Ergebnissen die richtigen Schlüsse zu ziehen. Seit Mitte der 1990er Jahre wurde dafür das interdisziplinäre Wissenschaftsfeld der Datenwissenschaften (Data Science) geschaffen. Seitdem ist die Nachfrage nach „Data Scientists“ in Unternehmen stark gewachsen. Als Vermittler zwischen Datenproduzenten und Datennutzern nehmen sie die Rolle von Übersetzern ein, die komplexe Zusammenhänge nicht nur analysieren können, sondern sie auch für Fachanwender und Geschäftsführung verständlich aufbereiten.

Was Data Science wirklich bringt

Die Vorteile einer umfassenden Datenanalyse lassen sich am besten an konkreten Beispielen beschreiben: In der Produktion helfen Sensordaten etwa dabei, Fertigungsprozesse effizienter, schneller und weniger fehleranfällig zu machen. Zeigt eine Produktionsmaschine Abweichungen vom Normbetrieb, kann sie vorsorglich gewartet und ein Ausfall verhindert werden. Melden die Füllstandsensoren im Lager einen sinkenden Bestand einer bestimmten Komponente, lässt sich diese gezielt nachbestellen oder aus anderen Fertigungsstandorten beziehen, um die Produktion aufrecht zu erhalten. Fertige Produkte können durch KI-basierte Bildbearbeitung automatisiert auf Fehler geprüft und so der Ausschuss minimiert werden. Im Idealfall laufen alle diese Informationen in einem „Digitalen Zwilling“ zusammen. Er stellt die virtuelle Repräsentation des kompletten Produktionsprozesses dar und erlaubt es den Datenwissenschaftlern, Änderungen am Modell zu erproben, ohne dass die tatsächliche Produktion beeinträchtigt wird.

Auch in der Medizin spielen Daten und deren Auswertung eine immer größere Rolle – so auch bei der Corona-Bekämpfung. Die Berliner Charité und das Berlin Institut of Health (BIH) sequenzierten beispielsweise die RNA in Tausenden von Zellen, um zu verstehen, welche Rezeptoren und Kofaktoren für eine Infektion notwendig sind und wie die Wirtszellen auf die Virusinfektion reagieren. So konnten die Wissenschaftler beispielsweise besser erklären, warum Kinder deutlich seltener einen schweren Krankheitsverlauf aufweisen als Erwachsene.

Der Einzelhandel profitiert ebenfalls stark von einer intensiven Datenanalyse. Informationen über das Kaufverhalten lassen sich beispielsweise nutzen, um Kunden weitere passende Produkte zu empfehlen oder Angebote für Cross- und Upselling zu machen. Daten über Lagerbestand, Abverkauf und Logistik helfen, Engpässe oder Überbestände zu prognostizieren und mit automatisierten Bestellvorgängen oder dynamischen Preisanpassungen gegenzusteuern.

Herausforderungen für Datenwissenschaftler

Um diese und viele andere Aufgaben in Unternehmen erfüllen zu können, benötigen Data Scientists einen möglichst ungehinderten Zugang zu allen anfallenden Informationen. Dabei stoßen sie allerdings häufig auf Widerstände. Abteilungen betrachten ihre Daten allzu oft als „Privatbesitz“ und kooperieren nur widerwillig. Wenn doch Informationen übermittelt werden, sind diese teilweise fehlerhaft oder falsch formatiert.

Auch der Datenschutz kann die Arbeit des Data Scientist behindern, etwa wenn sich die IT-Abteilung aus rechtlichen Gründen weigert, sensible oder personenbezogene Daten herauszugeben. Die technische Ausstattung lässt ebenfalls oft zu wünschen übrig, was zu Verzögerungen im Analyseprozess führt. Die Folgen können gravierend sein, etwa wenn Risiken oder neue Geschäftschancen nicht rechtzeitig erkannt werden.

Wie Unternehmen perfekte Data-Science-Bedingungen generieren

Um optimale Voraussetzungen für Datenwissenschaftler zu schaffen, ist eine kooperative und vertrauensvolle Firmenkultur entscheidend. Fachabteilungen und die IT müssen verstehen, wie ihre Daten zum Gesamterfolg des Unternehmens beitragen können, und was die Data Scientists benötigen, um gute Arbeit zu machen.

Doch auch die technische Ausstattung der Data Scientists spielt eine wichtige Rolle. Die Datenwissenschaftler sollten über alle Optionen der Datenverarbeitung verfügen. Dabei werden neben Cloud-Ressourcen lokal einsetzbare Workstations immer wichtiger. Sie bieten nicht nur hohe Leistung und Verfügbarkeit bei gleichzeitig geringer Latenz, sondern lösen auch Datenschutzprobleme, da sie sensible Informationen in einem geschlossenen Workflow halten, und so der Zugriff Dritter auf vertrauliche Daten wirksam verhindert wird.

Die perfekte Data-Science-Umgebung beginnt schon beim Setup der eingesetzten Workstations. Es empfiehlt sich, alle Software- und Library-Anforderungen in einer Textdatei zusammenzufassen. Zu den bekanntesten und beliebtesten Werkzeugen und Libraries gehören Jupyter Notebook, R Studio, Spyder IDE und PyTorch, die beispielsweise über Data-Science-Plattformen wie Anaconda installiert werden können. Ein guter Startpunkt ist außerdem die Online-Community Kaggle, auf der mehr als 50.000 öffentliche Datensätze und über 400.000 öffentliche Data-Science-Projekte (Notebooks) zu finden sind.

Besonders schnell startbereit sind Datenwissenschaftler, wenn ihnen das Unternehmen vorinstallierte Data-Science-Workstations zur Verfügung stellt, wie sie beispielsweise Z by HP bietet. Auf einer Ubuntu-Plattform sind bereits alle Werkzeuge, Entwicklungsumgebungen und Libraries installiert, die ein Datenwissenschaftler benötigt. Versionsprobleme und Abhängigkeiten, die eine manuelle Installation kompliziert machen können, werden so vermieden. Dadurch sind Anwender in wenigen Minuten produktiv. Neben Workstations wie der HP Z4 G4 und der HP Z8 G4, die für den stationären Einsatz konzipiert sind, bietet Z by HP mit dem HP ZBook 17 G6 auch eine mobile Plattform, die es Data Scientists ermöglicht, ortsunabhängig von Zuhause, im Büro oder unterwegs zu arbeiten. Dank des Hochleistungs-Grafikprozessors NVIDIA Quattro RTX 5000, dem schnellen Intel-Prozessor Core i9 + 9980H, 64 GB RAM und bis zu zwei TB PCIe NVMe SSDs können Datenwissenschaftler in wenigen Minuten bis zu einer Milliarde Datensätze verarbeiten.

Fazit: Data Science braucht mehr als Daten

Die digitale Transformation ist ohne intensive Datennutzung nicht denkbar. Unternehmen benötigen fundierte Informationen, um Risiken erkennen, Prozesse optimieren und neue Geschäftschancen realisieren zu können. Data Scientists gehören deshalb zu den wertvollsten – und auch am meisten gefragten Mitarbeitern. Die nicht unerhebliche Investition in solch hochqualifizierte Fachkräfte verpufft jedoch in vielen Unternehmen, weil Daten nicht geteilt werden, nicht ordentlich aufbereitet sind oder nicht schnell und gründlich analysiert werden können. Data Scientists brauchen daher ein kooperatives und vertrauensvolles Umfeld, das den Wert ihrer Arbeit versteht und sie vorbehaltlos unterstützt. Wenn sie dann noch über die richtigen Werkzeuge verfügen, werden die Datenwissenschaftler zum echten Wettbewerbsvorteil.

47 Views / Downloads

Teilen

Warum Unternehmen an Data Science nicht mehr vorbeikommen

Inhaltstyp: Artikel
Z-Logo-Black.jpg

Kommentare und Feedback (0)