90 Prozent aller Unternehmensdaten liegen unstrukturiert vor und werden nur unzureichend ausgewertet. Dieses Whitepaper des Marktforschungsunternehmens IDC, für das mehr als 400 IT- und Business-Entscheider befragt wurden, zeigt, wo die größten Hindernisse liegen, wie sich die Daten besser nutzen lassen und welche Rolle generative KI dabei spielt.
Inhalt:
E-Mails und Besprechungsprotokolle, Vertragsentwürfe und Finanzberichte, Marketingdokumente und Vertriebsunterlagen – jährlich fallen laut dem Marktforschungsunternehmen IDC mehr als 70.000 Exabyte (= 70 Milliarden Terabyte) solcher unstrukturierter Unternehmensdaten an.
Doch nur die Hälfte dieser Daten wird laut IDC ausgewertet, weniger als ein Drittel für weitergehende Analysen wiederverwendet. Damit entgehen Unternehmen wertvolle Erkenntnisse. Sie verpassen unter anderem die Chance, generative KI-Modelle zu trainieren oder zu verbessern, Produktionsprozesse zu optimieren oder Sicherheitsrisiken frühzeitig zu erkennen.
Woran die unzureichende Auswertung unstrukturierter Daten liegt und wie die Defizite behoben werden können, erläutern die Analysten von IDC in diesem Whitepaper. Für die Studie wurden mehr als 400 IT- und Business-Entscheider aus mittelständischen und großen Unternehmen befragt.
Sie beantwortet unter anderem folgende Fragen:
- Was hindert Unternehmen vor allem daran, unstrukturierte Daten besser zu nutzen?
- Wie setzen Unternehmen generative KI vornehmlich ein und was planen sie für die Zukunft?
- Wie könnten Hemmnisse bei der Analyse unstrukturierter Daten überwunden werden?
Originalauszug aus dem Dokument:
In dem Maße, wie die Begeisterung über das Potenzial von GenKI wächst, nimmt auch die Erkenntnis zu, dass ihre Effizienz von der strategischen Verwaltung der unstrukturierten Daten eines Unternehmens abhängt. Sowohl GenKI- als auch klassische KI-Anwendungsfälle hängen von verschiedenen KI-Modellen ab, die auf einer Mischung aus internen, proprietären unstrukturierten Daten und externen offenen Daten angelernt werden. Ganz gleich, ob es darum geht, neue Modelle aus langen Text-, Video- oder Bilddateien anzulernen, wird erwartet, dass Technologieführer eine Strategie entwickeln, um alle verfügbaren unstrukturierten Daten auf sichere Weise zu identifizieren, zu klassifizieren und zu vereinheitlichen und sie KI- und Data-Science-Experten zur Verfügung zu stellen, ohne dass die Gefahr besteht, dass geistiges Eigentum verloren geht.
Tatsächlich ist das von den Teilnehmern unserer Umfrage am häufigsten genannte Hindernis für die Einführung von GenKI die Sorge um die Freigabe unternehmenseigener Inhalte für die großen Sprachmodelle der GenKI-Technologieanbieter. Hinzu kommt die Unklarheit bezüglich der Rechte am geistigen Eigentum an den Inhalten, die im Rahmen der automatischen Generierung neuer Inhalte durch GenKI verwendet werden, sowie der Umgang mit der Wahrnehmung der Mitarbeiter hinsichtlich der Automatisierung bestehender Arbeitsfunktionen.