Zum Hauptinhalt springen
Zusammen das Data-Center weiterentwickeln

Zusammen das Data-Center weiterentwickeln

So wird das Data Center fit für Künstliche Intelligenz

So wird das Data Center fit für Künstliche Intelligenz
Advanced Micro Devices GmbH
Firma: Advanced Micro Devices GmbH
Sprache: Deutsch
Größe: 1 Seite
Erscheinungsjahr: 2024
Besonderheit: registrierungsfrei
Aktuell,
relevant und
hier zuerst!

Cloud-Services für KI sind einfach und flexibel zu nutzen, haben aber auch Nachteile. Wenn etwa sensible Daten verarbeitet werden sollen oder Latenz eine entscheidende Rolle spielt, ist das Training und die Nutzung von Machine-Learning-Algorithmen im eigenen Rechenzentrum die bessere Alternative. Bei der KI-freundlichen Data-Center-Modernisierung sind jedoch einige Punkte zu beachten.

Öffentlich zugängliche Cloud-Ressourcen (Public Cloud) bieten für das Training und die Anwendung von Machine-Learning-Algorithmen und anderen Methoden der künstlichen Intelligenz (KI) viele Vorteile. Rechenleistung ist nahezu unbegrenzt verfügbar, leistungsfähige Server und für maschinelles Lernen optimierte Grafikprozessoren (GPU) lassen sich einfach buchen oder auch wieder abbestellen. Es ist daher kein Wunder, dass Marktforscher dem globalen Cloud-KI-Markt ein Wachstum von mehr als 30 Prozent im Jahr vorhersagen. Allerdings ist die Public Cloud nicht in jedem Fall die beste Option für das Training und die Anwendung von KI. Es kann sich durchaus lohnen, KI-Workloads im eigenen Rechenzentrum zu betreiben. Dafür sprechen vor allem folgende Aspekte:

Langfristige Kostenersparnis: Die nutzungsabhängige Abrechnung in einer Public Cloud ist einer ihrer wichtigsten Vorteile. Statt vorab hohe Summen in IT-Infrastruktur zu investieren und Kapital zu binden, können Unternehmen ihre Ausgaben in der Cloud auf einen längeren Zeitraum verteilen. Dieser Vorteil kann sich jedoch ins Gegenteil verkehren, wenn man die Gesamtkosten betrachtet. Im lokalen Rechenzentrum fallen zwar zunächst Investitionen für die Anschaffung von Servern und Grafikprozessoren an, die Nutzung der IT-Ressourcen selbst ist jedoch deutlich günstiger, als wenn die gleiche Leistung in einer Cloud gebucht wird. Zudem müssen viele Machine-Learning-Algorithmen regelmäßig neu trainiert werden, um sie zu verbessern und an veränderte Rahmenbedingungen anzupassen. Im lokalen Data Center kann dafür die vorhandene Infrastruktur verwendet werden, in der Cloud fallen für jede weitere Lernphase erneut Kosten an.

Maßgeschneiderte Konfiguration: Cloud-Ressourcen werden meist in festen Größen- und Leistungsklassen – etwa von „S“ bis „XL“ – angeboten, die Auswahl an Hauptprozessoren (CPU) und GPUs ist begrenzt. Auch bei den Tools und Frameworks für die Erstellung, das Training und die Anwendung von KI-Modellen bietet die Cloud zwangsläufig nur eine begrenzte Auswahl. Beim Aufbau einer eigenen KI-Infrastruktur können Unternehmen aus einem weitaus größeren Angebot wählen. Eine optimale, auf die individuellen Anforderungen zugeschnittene Konfiguration lässt sich deshalb im eigenen Rechenzentrum deutlich einfacher realisieren als in einer Cloud-Umgebung.

Entscheidungen in Echtzeit: In der Smart Factory und anderen digitalisierten Industrieumgebungen fallen große Mengen an Sensordaten an. Um Prozesse in Echtzeit steuern zu können, müssen diese Daten möglichst schnell ausgewertet werden. Die Übertragung in eine Public Cloud dauert dafür zu lange. Kurze Wege im eigenen Rechenzentrum reduzieren die Latenz und ermöglichen so eine deutlich schnellere Datenverarbeitung.

Datenschutz und Compliance: Machine-Learning-Algorithmen benötigen für das Training große Mengen teils sensibler Daten, die nicht in falsche Hände geraten dürfen. Personenbezogene Informationen oder Geschäftsgeheimnisse lassen sich im eigenen Rechenzentrum wesentlich besser vor fremden Zugriffen schützen als in einer Public Cloud. Auch interne Sicherheitsrichtlinien sind wesentlich einfacher umzusetzen und zu kontrollieren. In stark regulierten Branchen wie dem Banken- und dem Gesundheitswesen sowie in Behörden und anderen staatlichen Einrichtungen ist die Nutzung einer Public Cloud ohnehin nicht oder nur mit Einschränkungen möglich.

Die Vorteile eines modernen Rechenzentrums

Machine Learning und andere KI-Workloads stellen hohe Anforderungen an die Leistungsfähigkeit der Server. Nach Untersuchungen des Marktforschungsinstituts S&P Global Market Intelligence gehört die Modernisierung der Serverlandschaft daher zu den Top-Prioritäten der Unternehmen. Die Investition in neue Server lohnt sich aber auch noch aus anderen Gründen. Aktuelle Plattformen verbrauchen weniger Strom als ihre Vorgänger und weisen ein besseres thermisches Design auf. Das reduziert den Energieverbrauch und die Anforderungen an die Kühlung. Server, die mit AMD EPYC-Prozessoren der vierten Generation ausgestattet sind, verbrauchen beispielsweise bis zu 29 Prozent weniger Strom als vergleichbare ältere Modelle.

Moderne Plattformen sind zudem einfacher zu administrieren und verfügen über verbesserte integrierte Sicherheitsfunktionen. Auch bei Ausfallsicherheit und Zuverlässigkeit haben die Serverhersteller deutliche Fortschritte gemacht. Moderne Server weisen zudem eine höhere Leistungsdichte auf. Unternehmen können daher bestehende Anwendungen auf weniger Geräten konsolidieren und so Platz für Wachstum und neue Aufgaben schaffen. Moderne Server eignen sich außerdem besser für virtualisierte Workloads und die Integration in Hybrid-Cloud-Umgebungen.

In fünf Schritten zum neuen Data Center

Unternehmen, die ihr Rechenzentrum fit für KI machen wollen, sollten folgendermaßen vorgehen:

  1. Ist-Zustand dokumentieren. Zunächst gilt es, sich einen Überblick über die vorhandenen Ressourcen zu verschaffen. Welche Server, Speicher- und Netzwerkkomponenten sind am Ende ihres Lebenszyklus? Welche verbrauchen am meisten Energie und Platz? Gibt es Engpässe oder sogar einen Single Point of Failure?
  2. Soll-Anforderungen definieren. Machine-Learning-Algorithmen und andere KI-Methoden gelten als extrem leistungshungrig. Doch nicht jedes Modell muss mit Petabytes an Daten trainiert werden und Millionen von Parametern berücksichtigen. Es ist daher wichtig, zunächst die Anforderungen für die geplanten Projekte zu definieren und eine Roadmap für zukünftige Entwicklungen zu erstellen.
  3. Zielarchitektur bestimmen. Sind Ist-Zustand und Anforderungen klar, kann die Zielarchitektur bestimmt werden. Bei der Auswahl geeigneter Server helfen Werkzeuge wie das AMD Epyc Processor Selector Tool. Sie ermöglichen es, verschiedene Serverarchitekturen zu vergleichen und die optimale Konfiguration für die definierten Anforderungen zu finden.
  4. Migration vorbereiten. Die Modernisierung auf eine neue Prozessorarchitektur kann eine Plattformmigration erforderlich machen. Vor der Umstellung ist daher zu klären, welche Anpassungen notwendig sind, und wie sich diese unterbrechungsfrei umsetzen lassen.
  5. Modernisierung durchführen. Die Kosten und der Aufwand für die Migration auf moderne Server werden durch Migrationstools verringert, die den Wechsel von einer Prozessorarchitektur zu einer anderen ermöglichen. Das VMware Architecture Migration Tool (VAMT) bietet beispielsweise eine einfache und automatisierte Migration von virtuellen Maschinen auf eine andere Prozessorarchitektur.

Fazit: Keine Modernisierung ist keine Lösung

Die Attraktivität von Cloud-Services lässt Entscheider mitunter am Sinn einer Rechenzentrumsmodernisierung zweifeln oder gar über die Abschaffung des eigenen Data Centers nachdenken. In Deutschland verfolgen laut dem Digitalverband Bitkom bereits 11 Prozent der Unternehmen eine solche Cloud-only-Strategie. Mit dieser Entscheidung begibt man sich jedoch in eine gefährliche Abhängigkeit. Nicht nur bei der Entwicklung und Anwendung von KI-Modellen sind Unternehmen ohne eigenes modernes Rechenzentrum auf das Angebot der Public-Cloud-Provider und deren Preisgestaltung angewiesen. Werden wichtige Services abgekündigt oder steigen die Kosten unerwartet, kann dies erhebliche Folgen für die Wirtschaftlichkeit und Wettbewerbsfähigkeit haben. Die Verlagerung sensibler Daten in eine Public Cloud birgt zudem rechtliche Risiken.

Unternehmen sind daher gut beraten, ihr bestehendes Rechenzentrum so zu modernisieren, dass es nicht nur für KI-Aufgaben die optimale IT-Infrastruktur bietet, sondern auch in puncto Energieeffizienz auf dem neuesten Stand ist. Ein solches Data Center kann zudem nahtlos in eine Hybrid-Cloud-Umgebung integriert werden. So lassen sich die Vorteile beider Welten optimal nutzen.

So wird das Data Center fit für Künstliche Intelligenz

Inhaltstyp: Artikel
Advanced Micro Devices GmbH