Kael Zhang
AMDAI Developer DayLisa SuKI-AgentCPUGPURechenleistungRechenzentrum

AMD AI Developer Day erstmals in China: Lisa Su setzt auf Agents, CPU-GPU-Verhältnis erreicht 1:1

Kael Zhang

Am 19. Mai veranstaltete AMD seinen ersten AI Developer Day in China – zum ersten Mal in der Geschichte verließ diese Veranstaltung amerikanischen Boden.

In der Halle standen Zuschauer ohne Sitzplatz Reihe um Reihe an den Wänden. Die Keynote von AMD-Vorsitzender und CEO Lisa Su ließ sich auf zwei Dinge reduzieren: Agenten und die Rückkehr der CPU.


Zwei kritische Einschätzungen

Einschätzung Eins: CPUs werden kritischer als je zuvor

Su präsentierte die Zahlen direkt:

In traditionellen Rechenzentren beträgt das CPU-zu-GPU-Verhältnis 1:4. Bis 2026 wird dieses Verhältnis 1:1.

Was bedeutet das?

In den letzten zehn Jahren wurden KI-Rechenleistungs-Narrative von GPUs monopolisiert. Das Training großer Modelle erfordert CUDA; Inferenz-Beschleunigung hängt von Tensor Cores ab. CPUs wurden als “Kontrollebenen” marginalisiert – sie erteilen Befehle, beteiligen sich aber nicht an der Hauptberechnung.

Sus Einschätzung: Im Agenten-Zeitalter verschieben sich die Rechenarbeitslasten.

Das Verhältnis 1:1 ist keine Vorhersage; es ist eine Erklärung. AMD nutzt sein EPYC-Prozessorportfolio, um die Diskussion über Rechenzentren zurückzugewinnen.


Einschätzung Zwei: China ist eine reiche Ader von Rechenbedarf

Die Verlegung der Entwicklerkonferenz nach China ist keine Marken-PR – es ist strategische Positionierung.

Chinas KI-Anwendungsbereitstellungsgeschwindigkeit, die Dichte der Agenten-Einführung in Unternehmen und das Volumen der Rechenleistungsbeschaffung rangieren alle in der globalen ersten Liga. Sus impliciter Text auf der Bühne war klar: Wer die Entwickler in China nicht gewinnt, gewinnt den KI-Infrastrukturkrieg nicht global.

AMDs aktuelle Herausforderungen:

Aber AMDs Karten sind ebenfalls klar:


Was Agenten verändern

Agenten sind nicht nur “bessere Chatbots”. Ihre technischen Merkmale treiben grundlegende Architekturverschiebungen:

MerkmalRechenleistungs-Auswirkung
Mehrstufige AufgabenPersistente Zustandsverwaltung erforderlich; CPU-Planungslast steigt
Tool-AufrufeHäufiger I/O; Speicherbandbreite und Latenz empfindlich
Langer KontextKV-Cache-Aufblähung; Speicherkapazität wird harte Beschränkung
Multimodale EingabeKomplexe Vorverarbeitungs-Pipelines; heterogene Rechenanforderungen steigen
EchtzeitentscheidungenNiedrige Latenz-Inferenz; kann nicht jedes Mal durch volle GPU-Pipeline routen

Diese Merkmale weisen kollektiv auf einen Schluss hin: KI-Infrastruktur verschiebt sich von “GPU-Einzelmaschinen-Brachialgewalt” zu “CPU+GPU-kollaborativer Feinarchitektur.”

AMD hält sowohl EPYC als auch Instinct – das gibt ihm das Selbstvertrauen, 1:1 zu verkünden.


Wettbewerbslandschaft: Dreier-Stillstand

AnbieterCPU-VorteilGPU-VorteilÖkosystem
NVIDIASchwach (Grace noch nicht breit eingesetzt)Dominant (CUDA-Ökosystem)Geschlossen aber reif
AMDStark (EPYC)Moderat (ROCm holt auf)Open-Source-Route
IntelModerat (Xeon Marktanteil sinkend)Schwach (Gaudi begrenzte Reichweite)oneAPI-Promotion läuft

AMDs Strategie ist explizit: Nutzen Sie die CPU-Installationsbasis, um GPU-Inkrementalpenetration zu treiben. Agenten sind der perfekte Einstiegspunkt – denn in diesem Szenario ist die CPU kein Nebendarsteller mehr.


Praktische Auswirkungen für Entwickler

Wenn Sie ein KI-Anwendungsentwickler sind, was bedeutet das?

  1. Heterogene Programmierung wird Standard. Reine CUDA-Fähigkeiten verlieren an Wert; Ingenieure, die Arbeitslasten zwischen CPU und GPU verteilen können, sind knapper
  2. Inferenzoptimierung ist wertvoller als Trainingsoptimierung. Im Agenten-Zeitalter entfallen 90% des Rechenverbrauchs auf Inferenz und Planung, nicht auf Training
  3. Hardware-Lock-in-Risiko muss abgesichert werden. ROCm, oneAPI und CUDA werden jahrelang koexistieren. Binden Sie Ihren Code nicht an eine einzelne Plattform

Fazit

AMD, der AI Developer Day nach China zu verlegen, ist sowohl ein Signal als auch eine Wette.

Das Signal: Im Agenten-Zeitalter wird die Rechenarchitektur neu geformt, und CPUs sind keine GPU-Zubehörteile mehr.

Die Wette: Kann ROCm im Schatten von CUDA den Agenten-Rückenwind nutzen, um im Ökosystem durchzubrechen?

Su hat diese Frage nicht direkt beantwortet. Aber die Verlegung der Konferenz nach China ist selbst die Antwort – der Bedarf hier ist groß genug, um die Regeln neu zu definieren.