AMDAI Developer DayLisa SuKI-AgentCPUGPURechenleistungRechenzentrum

AMD AI Developer Day erstmals in China: Lisa Su setzt auf Agents, CPU-GPU-Verhältnis erreicht 1:1

Kael Zhang 21. Mai 2026

Am 19. Mai veranstaltete AMD seinen ersten AI Developer Day in China – zum ersten Mal in der Geschichte verließ diese Veranstaltung amerikanischen Boden.

In der Halle standen Zuschauer ohne Sitzplatz Reihe um Reihe an den Wänden. Die Keynote von AMD-Vorsitzender und CEO Lisa Su ließ sich auf zwei Dinge reduzieren: Agenten und die Rückkehr der CPU.

Zwei kritische Einschätzungen

Einschätzung Eins: CPUs werden kritischer als je zuvor

Su präsentierte die Zahlen direkt:

In traditionellen Rechenzentren beträgt das CPU-zu-GPU-Verhältnis 1:4. Bis 2026 wird dieses Verhältnis 1:1.

Was bedeutet das?

In den letzten zehn Jahren wurden KI-Rechenleistungs-Narrative von GPUs monopolisiert. Das Training großer Modelle erfordert CUDA; Inferenz-Beschleunigung hängt von Tensor Cores ab. CPUs wurden als “Kontrollebenen” marginalisiert – sie erteilen Befehle, beteiligen sich aber nicht an der Hauptberechnung.

Sus Einschätzung: Im Agenten-Zeitalter verschieben sich die Rechenarbeitslasten.

Agenten sind keine Einmal-Inferenz; sie sind mehrstufige, langfristige Aufgabenabläufe
Jeder Schritt erfordert Planung, Entscheidungsfindung und Zustandsverwaltung – CPUs sind hierin exzellent
Wenn GPUs parallele Berechnungen durchführen, koordiniert CPUs seriell. Beide sind unverzichtbar

Das Verhältnis 1:1 ist keine Vorhersage; es ist eine Erklärung. AMD nutzt sein EPYC-Prozessorportfolio, um die Diskussion über Rechenzentren zurückzugewinnen.

Einschätzung Zwei: China ist eine reiche Ader von Rechenbedarf

Die Verlegung der Entwicklerkonferenz nach China ist keine Marken-PR – es ist strategische Positionierung.

Chinas KI-Anwendungsbereitstellungsgeschwindigkeit, die Dichte der Agenten-Einführung in Unternehmen und das Volumen der Rechenleistungsbeschaffung rangieren alle in der globalen ersten Liga. Sus impliciter Text auf der Bühne war klar: Wer die Entwickler in China nicht gewinnt, gewinnt den KI-Infrastrukturkrieg nicht global.

AMDs aktuelle Herausforderungen:

Das CUDA-Ökosystem-Graben bleibt tief
Die ROCm-Reife hinkt noch hinter nvcc + cuDNN her
Entwickler-Migrationskosten sind real

Aber AMDs Karten sind ebenfalls klar:

EPYCs Marktanteil für Rechenzentrums-CPUs steigt kontinuierlich
MI-Serie-GPUs bieten Inferenz-Kosten-Leistungs-Vorteile
Die Open-Source-Route spricht große Unternehmen an, die eine Einzelanbieter-Bindung vermeiden möchten

Was Agenten verändern

Agenten sind nicht nur “bessere Chatbots”. Ihre technischen Merkmale treiben grundlegende Architekturverschiebungen:

Merkmal	Rechenleistungs-Auswirkung
Mehrstufige Aufgaben	Persistente Zustandsverwaltung erforderlich; CPU-Planungslast steigt
Tool-Aufrufe	Häufiger I/O; Speicherbandbreite und Latenz empfindlich
Langer Kontext	KV-Cache-Aufblähung; Speicherkapazität wird harte Beschränkung
Multimodale Eingabe	Komplexe Vorverarbeitungs-Pipelines; heterogene Rechenanforderungen steigen
Echtzeitentscheidungen	Niedrige Latenz-Inferenz; kann nicht jedes Mal durch volle GPU-Pipeline routen

Diese Merkmale weisen kollektiv auf einen Schluss hin: KI-Infrastruktur verschiebt sich von “GPU-Einzelmaschinen-Brachialgewalt” zu “CPU+GPU-kollaborativer Feinarchitektur.”

AMD hält sowohl EPYC als auch Instinct – das gibt ihm das Selbstvertrauen, 1:1 zu verkünden.

Wettbewerbslandschaft: Dreier-Stillstand

Anbieter	CPU-Vorteil	GPU-Vorteil	Ökosystem
NVIDIA	Schwach (Grace noch nicht breit eingesetzt)	Dominant (CUDA-Ökosystem)	Geschlossen aber reif
AMD	Stark (EPYC)	Moderat (ROCm holt auf)	Open-Source-Route
Intel	Moderat (Xeon Marktanteil sinkend)	Schwach (Gaudi begrenzte Reichweite)	oneAPI-Promotion läuft

AMDs Strategie ist explizit: Nutzen Sie die CPU-Installationsbasis, um GPU-Inkrementalpenetration zu treiben. Agenten sind der perfekte Einstiegspunkt – denn in diesem Szenario ist die CPU kein Nebendarsteller mehr.

Praktische Auswirkungen für Entwickler

Wenn Sie ein KI-Anwendungsentwickler sind, was bedeutet das?

Heterogene Programmierung wird Standard. Reine CUDA-Fähigkeiten verlieren an Wert; Ingenieure, die Arbeitslasten zwischen CPU und GPU verteilen können, sind knapper
Inferenzoptimierung ist wertvoller als Trainingsoptimierung. Im Agenten-Zeitalter entfallen 90% des Rechenverbrauchs auf Inferenz und Planung, nicht auf Training
Hardware-Lock-in-Risiko muss abgesichert werden. ROCm, oneAPI und CUDA werden jahrelang koexistieren. Binden Sie Ihren Code nicht an eine einzelne Plattform

Fazit

AMD, der AI Developer Day nach China zu verlegen, ist sowohl ein Signal als auch eine Wette.

Das Signal: Im Agenten-Zeitalter wird die Rechenarchitektur neu geformt, und CPUs sind keine GPU-Zubehörteile mehr.

Die Wette: Kann ROCm im Schatten von CUDA den Agenten-Rückenwind nutzen, um im Ökosystem durchzubrechen?

Su hat diese Frage nicht direkt beantwortet. Aber die Verlegung der Konferenz nach China ist selbst die Antwort – der Bedarf hier ist groß genug, um die Regeln neu zu definieren.