AMD AI Developer Day erstmals in China: Lisa Su setzt auf Agents, CPU-GPU-Verhältnis erreicht 1:1
Am 19. Mai veranstaltete AMD seinen ersten AI Developer Day in China – zum ersten Mal in der Geschichte verließ diese Veranstaltung amerikanischen Boden.
In der Halle standen Zuschauer ohne Sitzplatz Reihe um Reihe an den Wänden. Die Keynote von AMD-Vorsitzender und CEO Lisa Su ließ sich auf zwei Dinge reduzieren: Agenten und die Rückkehr der CPU.
Zwei kritische Einschätzungen
Einschätzung Eins: CPUs werden kritischer als je zuvor
Su präsentierte die Zahlen direkt:
In traditionellen Rechenzentren beträgt das CPU-zu-GPU-Verhältnis 1:4. Bis 2026 wird dieses Verhältnis 1:1.
Was bedeutet das?
In den letzten zehn Jahren wurden KI-Rechenleistungs-Narrative von GPUs monopolisiert. Das Training großer Modelle erfordert CUDA; Inferenz-Beschleunigung hängt von Tensor Cores ab. CPUs wurden als “Kontrollebenen” marginalisiert – sie erteilen Befehle, beteiligen sich aber nicht an der Hauptberechnung.
Sus Einschätzung: Im Agenten-Zeitalter verschieben sich die Rechenarbeitslasten.
- Agenten sind keine Einmal-Inferenz; sie sind mehrstufige, langfristige Aufgabenabläufe
- Jeder Schritt erfordert Planung, Entscheidungsfindung und Zustandsverwaltung – CPUs sind hierin exzellent
- Wenn GPUs parallele Berechnungen durchführen, koordiniert CPUs seriell. Beide sind unverzichtbar
Das Verhältnis 1:1 ist keine Vorhersage; es ist eine Erklärung. AMD nutzt sein EPYC-Prozessorportfolio, um die Diskussion über Rechenzentren zurückzugewinnen.
Einschätzung Zwei: China ist eine reiche Ader von Rechenbedarf
Die Verlegung der Entwicklerkonferenz nach China ist keine Marken-PR – es ist strategische Positionierung.
Chinas KI-Anwendungsbereitstellungsgeschwindigkeit, die Dichte der Agenten-Einführung in Unternehmen und das Volumen der Rechenleistungsbeschaffung rangieren alle in der globalen ersten Liga. Sus impliciter Text auf der Bühne war klar: Wer die Entwickler in China nicht gewinnt, gewinnt den KI-Infrastrukturkrieg nicht global.
AMDs aktuelle Herausforderungen:
- Das CUDA-Ökosystem-Graben bleibt tief
- Die ROCm-Reife hinkt noch hinter nvcc + cuDNN her
- Entwickler-Migrationskosten sind real
Aber AMDs Karten sind ebenfalls klar:
- EPYCs Marktanteil für Rechenzentrums-CPUs steigt kontinuierlich
- MI-Serie-GPUs bieten Inferenz-Kosten-Leistungs-Vorteile
- Die Open-Source-Route spricht große Unternehmen an, die eine Einzelanbieter-Bindung vermeiden möchten
Was Agenten verändern
Agenten sind nicht nur “bessere Chatbots”. Ihre technischen Merkmale treiben grundlegende Architekturverschiebungen:
| Merkmal | Rechenleistungs-Auswirkung |
|---|---|
| Mehrstufige Aufgaben | Persistente Zustandsverwaltung erforderlich; CPU-Planungslast steigt |
| Tool-Aufrufe | Häufiger I/O; Speicherbandbreite und Latenz empfindlich |
| Langer Kontext | KV-Cache-Aufblähung; Speicherkapazität wird harte Beschränkung |
| Multimodale Eingabe | Komplexe Vorverarbeitungs-Pipelines; heterogene Rechenanforderungen steigen |
| Echtzeitentscheidungen | Niedrige Latenz-Inferenz; kann nicht jedes Mal durch volle GPU-Pipeline routen |
Diese Merkmale weisen kollektiv auf einen Schluss hin: KI-Infrastruktur verschiebt sich von “GPU-Einzelmaschinen-Brachialgewalt” zu “CPU+GPU-kollaborativer Feinarchitektur.”
AMD hält sowohl EPYC als auch Instinct – das gibt ihm das Selbstvertrauen, 1:1 zu verkünden.
Wettbewerbslandschaft: Dreier-Stillstand
| Anbieter | CPU-Vorteil | GPU-Vorteil | Ökosystem |
|---|---|---|---|
| NVIDIA | Schwach (Grace noch nicht breit eingesetzt) | Dominant (CUDA-Ökosystem) | Geschlossen aber reif |
| AMD | Stark (EPYC) | Moderat (ROCm holt auf) | Open-Source-Route |
| Intel | Moderat (Xeon Marktanteil sinkend) | Schwach (Gaudi begrenzte Reichweite) | oneAPI-Promotion läuft |
AMDs Strategie ist explizit: Nutzen Sie die CPU-Installationsbasis, um GPU-Inkrementalpenetration zu treiben. Agenten sind der perfekte Einstiegspunkt – denn in diesem Szenario ist die CPU kein Nebendarsteller mehr.
Praktische Auswirkungen für Entwickler
Wenn Sie ein KI-Anwendungsentwickler sind, was bedeutet das?
- Heterogene Programmierung wird Standard. Reine CUDA-Fähigkeiten verlieren an Wert; Ingenieure, die Arbeitslasten zwischen CPU und GPU verteilen können, sind knapper
- Inferenzoptimierung ist wertvoller als Trainingsoptimierung. Im Agenten-Zeitalter entfallen 90% des Rechenverbrauchs auf Inferenz und Planung, nicht auf Training
- Hardware-Lock-in-Risiko muss abgesichert werden. ROCm, oneAPI und CUDA werden jahrelang koexistieren. Binden Sie Ihren Code nicht an eine einzelne Plattform
Fazit
AMD, der AI Developer Day nach China zu verlegen, ist sowohl ein Signal als auch eine Wette.
Das Signal: Im Agenten-Zeitalter wird die Rechenarchitektur neu geformt, und CPUs sind keine GPU-Zubehörteile mehr.
Die Wette: Kann ROCm im Schatten von CUDA den Agenten-Rückenwind nutzen, um im Ökosystem durchzubrechen?
Su hat diese Frage nicht direkt beantwortet. Aber die Verlegung der Konferenz nach China ist selbst die Antwort – der Bedarf hier ist groß genug, um die Regeln neu zu definieren.