Zum Hauptinhalt springen
Zusammen das Data-Center weiterentwickeln

Zusammen das Data-Center weiterentwickeln

KI-Fabrik: künstliche Intelligenz im industriellen Maßstab bereitstellen

KI-Fabrik: künstliche Intelligenz im industriellen Maßstab bereitstellen
Advanced Micro Devices GmbH
Firma: Advanced Micro Devices GmbH
Sprache: Deutsch
Größe: 1 Seite
Erscheinungsjahr: 2025
Besonderheit: registrierungsfrei
Aktuell,
relevant und
hier zuerst!

In der KI-Fabrik werden Entwicklung, Einsatz und Verwaltung von KI-Modellen und -Anwendungen standardisiert und automatisiert. Das bringt Vorteile, aber auch Herausforderungen.

Wie bei vielen Technologien geht auch bei der Entwicklung und Nutzung künstlicher Intelligenz der Trend zur Standardisierung. Vorgefertigte Systeme sollen den Zeit- und Ressourcenaufwand für die Entwicklung und Implementierung von KI-Lösungen deutlich reduzieren. Im Mittelpunkt dieses als „KI-Fabrik“ bezeichneten Konzepts steht die konsequente Automatisierung aller Prozesse – von der Datenerfassung und -vorbereitung über die Entwicklung und das Training von Modellen bis hin zur Bereitstellung dieser Modelle in Produktivumgebungen sowie deren kontinuierlicher Überwachung und Optimierung.

Im Unterschied zu traditionellen Rechenzentren, die ein breites Spektrum unterschiedlichster Workloads abdecken müssen, sind KI-Fabriken auf das Training und die Anwendung von KI spezialisiert. Die Hardwarearchitektur ist daher für die schnelle Übertragung, Speicherung und Verarbeitung sehr großer Datenmengen sowie den Einsatz neuronaler Netze und anderer KI-Verfahren optimiert. In KI-Fabriken kommen beispielsweise Hochgeschwindigkeits-Netzwerklösungen wie die AMD Pensando-Plattform zum Einsatz, die durch den direkten Datenaustausch zwischen Servern (Remote Direct Memory Access, RDMA) Latenzzeiten minimieren und hohe Übertragungsraten ermöglichen. Auch KI-Beschleuniger wie die AMD Instinct Serie sind in einer KI-Fabrik unverzichtbar. Sie sind für die in neuronalen Netzen typische Parallelverarbeitung optimiert und bieten Rechengeschwindigkeiten von mehreren TFLOPS (Tera Floating Point Operations per Second = Billionen Gleitkommaoperationen pro Sekunde).

Die Bausteine einer KI-Fabrik

KI-Fabriken zeichnen sich durch einen standardisierten modularen Aufbau aus. Er umfasst im Wesentlichen die folgenden Komponenten:

Automatisierte Datenpipeline: Der Datenbereich vereint alle Elemente und Prozesse, die eine kontinuierliche automatische Sammlung, Bereinigung, Validierung, Konsolidierung, Transformation, Kennzeichnung und Sicherung aller Unternehmensdaten ermöglichen. Ziel ist es, den manuellen Aufwand für die Datenerfassung und -aufbereitung zu minimieren und den Modellen qualitativ möglichst hochwertige, vollständige und aktuelle Informationen für das Training und Re-Training zur Verfügung zu stellen.

Modellentwicklung: Hier werden alle Ressourcen zusammengefasst, die für die Entwicklung und das Training von KI-Modellen benötigt werden. Dazu gehören neben KI-optimierten Servern auch Frameworks wie TensorFlow und PyTorch sowie Software-Stacks wie ADM ROCm. Automated Machine Learning Tools (AutoML) beschleunigen die Modellentwicklung, indem sie Aufgaben wie die Auswahl geeigneter Algorithmen, das Training der Modelle und die Qualitätssicherung automatisieren.

Bereitstellung: Eine leistungsfähige Inferencing-Plattform ist besonders für KI-Anwendungen wie Empfehlungssysteme oder Betrugserkennung wichtig, die schnelle Reaktionszeiten erfordern. Unternehmen sollten beim Aufbau einer KI-Fabrik auf eine IT-Infrastruktur setzen, die KI-Workloads optimal unterstützt. Server mit Prozessoren der AMD EPYC 9000 Serie können beispielsweise Inferencing-Aufgaben bis zu dreimal schneller ausführen als vergleichbare Modelle anderer Anbieter (hier mehr zu den Auswirkungen der CPU-Wahl auf die KI-Leistung).

Überwachung: Modelle können im Lauf ihrer Nutzung an Genauigkeit verlieren. Um eine solche sogenannte Modelldrift zu erkennen, ist ein kontinuierliches Monitoring der Vorhersageleistung unerlässlich. Aber auch andere Parameter wie Latenz und Verfügbarkeit sind durchgängig zu überwachen, um Performance-Probleme frühzeitig erkennen zu können.

MLOps: Analog zum DevOps-Prinzip, das die nahtlose Zusammenarbeit von Softwareentwicklung und -bereitstellung beschreibt, hat sich für KI-Fabriken Machine Learning Operations (MLOps) etabliert. Ziel von MLOps ist es, KI automatisiert zu entwickeln, zu testen, bereitzustellen und kontinuierlich zu verbessern.

In sechs Schritten zur eigenen KI-Fabrik

Eine KI-Fabrik aufzubauen und zu betreiben ist ein anspruchsvolles Vorhaben, das einer sorgfältigen Planung bedarf. Unternehmen, die diesen Weg gehen wollen, sollten die folgenden sechs Schritte beachten:

  1. Klare Ziele definieren: Die Realisierung einer eigenen KI-Fabrik ist mit erheblichen Investitionen verbunden. Dem Aufwand muss also ein klarer Nutzen gegenüberstehen. Unternehmen sollten deshalb zunächst klären, welche Ziele sie mit der KI-Fabrik verfolgen, welche Anwendungen, Prozesse und Geschäftsmodelle von einer KI-Fabrik profitieren würden und in welchem Zeitraum ein Return on Investment (ROI) zu erwarten ist.
  2. Ist-Zustand evaluieren: Unternehmen müssen eine KI-Fabrik nicht zwingend komplett neu aufbauen. Häufig können sie die vorhandene Infrastruktur auch ganz oder teilweise weiter verwenden. Eine Analyse des Ist-Zustands klärt den Erweiterungs- und Modernisierungsbedarf und ermöglicht es, das Investitionsvolumen besser abzuschätzen. (Mehr zum Thema Datacenter-Modernisierung in diesem Artikel).
  3. Partner finden: Hersteller wie Dell und AMD verfügen über langjährige Erfahrung im Aufbau und Betrieb leistungsfähiger IT-Infrastrukturen und können Unternehmen den Weg zur eigenen KI-Fabrik ebnen. AI-Factory-as-a-Service-Angebote, wie sie beispielsweise am europäischen Supercomputer Lumi angeboten werden, ermöglichen es Unternehmen, ohne hohe Vorabinvestitionen von den Vorteilen einer KI-Fabrik zu profitieren. (Hier gibt es weitere Informationen zu LUMI).
  4. Eine AI-Governance-Strategie formulieren: Unternehmen sollten klare ethische Richtlinien für die Entwicklung und den Einsatz ihrer KI-Systeme festlegen und sicherstellen, dass diese im Einklang mit gesetzlichen Vorgaben wie dem EU AI Act stehen. Auch die Frage, wie Daten erhoben, verarbeitet und geschützt werden sollen, muss vorab geklärt werden. Die AI-Governance-Strategie muss außerdem Kontrollmaßnahmen definieren, die die Einhaltung der Richtlinien sicherstellen.
  5. Abteilungsübergreifende KI-Teams bilden: Der Aufbau abteilungsübergreifender Teams ist ein wichtiger Schlüssel für den langfristigen Erfolg einer KI-Fabrik. Mitarbeiter aus IT und Softwareentwicklung, KI-Spezialisten und Vertreter der Fachbereiche sollten eng zusammenarbeiten, um Wissen auszutauschen, geeignete Anwendungsfälle für KI-Projekte zu identifizieren und deren Machbarkeit zu evaluieren.
  6. Erfolg messen: Der Erfolg einer KI-Fabrik lässt sich nur evaluieren, wenn er mit klaren Leistungskennzahlen (Key Performance Indicators, KPIs) verknüpft wird. Zu den KPIs, die regelmäßig gemessen werden sollten, gehören Datenqualität, Genauigkeit der Modelle, Antwortzeiten, Zahl der gleichzeitig bearbeitbaren Anfragen, Kosten pro Anfrage, erzielte Produktivitätseffekte sowie Auswirkungen auf Produktentwicklung (Time-to-Market) und Kundenzufriedenheit.

Fazit: Der Aufbau einer KI-Fabrik braucht klare Ziele

Die KI-Fabrik ist mehr als eine Ansammlung teurer Spezialhardware und neuer Tools. Sie ist vielmehr ein strategischer und systematischer Ansatz zur Entwicklung und Bereitstellung künstlicher Intelligenz im industriellen Maßstab. Der Aufbau und Betrieb einer KI-Fabrik ist kein triviales Unterfangen und bedarf einer sorgfältigen Planung. Unternehmen, die diesen Weg gehen wollen, müssen ein klares Ziel definieren, ihre spezifischen Bedürfnisse und Rahmenbedingungen sorgfältig analysieren und die passende Architektur wählen. Nur so kann die KI-Fabrik zu einem langfristigen Erfolg werden und einen schnellen ROI erzielen.

KI-Fabrik: künstliche Intelligenz im industriellen Maßstab bereitstellen

Inhaltstyp: Artikel
Advanced Micro Devices GmbH