Kael Zhang
KI-InfrastrukturNVIDIAAMDRechenzentrumCompute-Nachfrage

KI-Infrastruktur-Neubewertung: Jensen Huang meldet 1000% Compute-Nachfrage, CPU schlägt zurück

Kael Zhang

Im Mai 2026 wird die Erzählung um KI-Infrastruktur neu geschrieben.

Die letzten zwei Jahre drehte sich die Geschichte um GPUs – wer mehr H100 besaß, hatte das Ticket zur KI-Ära. Doch jetzt hat eine einzige Aussage von NVIDIA-CEO Jensen Huang die Compute-Architektur-Diskussion verändert: “Die für generative KI vor zwei Jahren nötige Rechenleistung ist im Vergleich zu heutiger Agentic AI um eintausend Prozent gestiegen.”

Das ist keine Übertreibung. Das ist der Beginn einer architektonischen Transformation.


Die Geschichte hinter den Zahlen

AMDs Q1-Ergebnis: Datacenter wird zur Kernmaschine

AMDs Datacenter-Umsatz im Q1 2026 erreichte 5,8 Mrd. $, ein Anstieg von 38% gegenüber dem Vorjahr. CEO Lisa Su erklärte unmissverständlich: “Datacenter-Umsätze sind jetzt der Haupttreiber unseres Umsatz- und Ertragswachstums.”

Kritischer ist die Auswirkung von KI-Agenten auf CPU-Nachfrage: Die AMD- und Intel-x86-Industriegruppe kündigte kürzlich den neuen Befehlssatz AI Compute Extensions (ACE) an, um die Leistungslücke zu GPUs zu schließen.

Signalinterpretation: CPUs sind nicht länger GPU-Komparsen – sie erobern ihren Status als First-Class-Citizens für KI-Workloads zurück.

NVIDIAs 1000%-Behauptung: Nicht GPU allein

Jensen Huangs 1000%-Steigerung der Compute-Nachfrage bedeutet nicht, dass GPU-Compute-Anforderungen um das 10-Fache wuchsen. Sie bedeutet die Full-Stack-Compute-Nachfrage – von “eine Antwort generieren” bis hin zu “autonom planen, ausführen, verifizieren und multi-step-Aufgaben iterieren”.

Das bedeutet:

Der UBS-Bericht beschreibt diese Verschiebung präzise: Das CPU-zu-GPU-Verhältnis in Rechenzentren verschiebt sich von 1:4 Richtung 1:1, in manchen Agenten-Konfigurationen sogar auf 4:1 (CPU-dominiert).


Infrastruktur-Neubewertung

Mehrere Institutionen erhöhten in Q1-Q2 2026 gleichzeitig ihre Infrastruktur-TAM-Prognosen:

InstitutionPrognoseUmfangAnpassung
Morgan StanleyServer-CPU-TAM bis 2030 bei 125 Mrd. $Nur CPU+25%
Goldman SachsToken-Verbrauch 24x bis 2030Voller Inferenz-StackNeue Prognose
UBSCPU:GPU-Verhältnis von 1:4 auf 1:1+Rechenzentrums-KonfigurationStrukturelle Verschiebung
NVIDIA (Jensen Huang)1000% Compute-Zuwachs für Agentic AIGesamte Compute-NachfrageSprung um eine Größenordnung

Das ist kein lineares Wachstum. Das ist eine Migration des architektonischen Schwerpunkts.

Der generative KI-Ausbau war GPU-dominiert. Der Agentic-AI-Ausbau fügt CPU-, Speicher- und Storage-Bedarf zusätzlich zur bestehenden GPU-Infrastruktur hinzu.


Energiekrise: Die Metapher des 40.000-Acre-Rechenzentrums

Anfang Mai genehmigte Box Elder County, Utah, ein 40.000 Acre großes Hyperscale-Rechenzentrum. Nach Fertigstellung soll es 9 Gigawatt Strom verbrauchen – mehr als doppelt so viel wie der aktuelle Gesamtverbrauch des Bundesstaates (4 Gigawatt).

Das Projekt wird teilweise vom “Shark Tank”-Investor Kevin O’Leary unterstützt.

Was diese Zahl bedeutet:

Teil des CPU-Comebacks ist Energieeffizienz. In bestimmten Agenten-Orchestrierungsszenarien übertrifft die Leistung pro Watt der CPU die GPU-Effizienz.


Von generativer KI zu Agentic AI: Architektonische Unterschiede

DimensionGenerative KIAgentic KI
KernaufgabeEinzel-Inferenz: Input→OutputMulti-step-Planung: Ziel→Zerlegung→Ausführung→Verifikation→Iteration
Compute-MusterGPU-intensivGPU+CPU-Hybrid, CPU-Anteil steigt
SpeicherbedarfInnerhalb des KontextfenstersSitzungsübergreifende Persistenz, Vektor-Datenbank-Retrieval
Storage-MusterModellgewichte + CacheAgenten-Zustand, Tool-Ergebnisse, Memory-Logs
Latenz-ToleranzLow-Latency-PrioritätEnd-to-End-Aufgabenabschlusszeit priorisiert
FehlerbehandlungEinzelne WiederholungMulti-step-Rollback, alternative Pfade, menschliche Übergabe

Dieser architektonische Unterschied erklärt, warum Agentic AI 10x Compute braucht: Nicht weil einzelne Inferenz teurer wurde, sondern weil Inferenzfrequenz und Koordinationskomplexität explodiert sind.


Auswirkungen auf Technologie-Entscheider

Infrastruktur-Beschaffung

Kostenmodellierung

Energiestrategie


Kernfazit

KI-Infrastruktur durchläuft einen Paradigmenwechsel vom “GPU-Zentralismus” hin zur “Heterogenen-Computing-Balance”.

Jensen Huangs 1000% sind keine Marketingzahl. Sie spiegeln eine architektonische Tatsache wider: Agentic AI ist kein “besserer Chatbot”, sondern ein “Workflow-System, das in der Lage ist, komplexe Aufgaben autonom auszuführen”. Solche Systeme sind koordinationsintensiv, nicht nur inferenzintensiv.

AMDs 38% Datacenter-Umsatzwachstum, Morgan Stanleys angehobene CPU-Marktprognose, UBS’ beobachtetes CPU:GPU-Verhältnis-Umkehren – diese unabhängigen Signale zeigen alle in dieselbe Richtung: CPUs erobern Terrain in der KI-Infrastruktur zurück.

Zukünftige KI-Rechenzentren werden keine bloßen “GPU-Farmen” sein. Sie sind heterogene Compute-Cluster, in denen CPU, GPU, Speicher, Storage und Netzwerk in neuem Gleichgewicht rekonfiguriert werden, um autonomen Agenten-Betrieb zu unterstützen.

Strom ist die ultimative harte Beschränkung. Das 40.000-Acre-, 9-Gigawatt-Utah-Projekt ist eine Warnung: Die Spannung zwischen exponentiellem Compute-Wachstum und linearem Stromangebot wird die KI-Infrastruktur der nächsten Dekade definieren.


Quellen: AMD Q1 2026 Earnings; NVIDIA GTC 2026 / Jensen Huang Statements, Mai 2026; Morgan Stanley Infrastructure TAM Revision, Q1-Q2 2026; UBS Data Center Configuration Report, 2026; Goldman Sachs Token Consumption Projection, Mai 2026; The Salt Lake Tribune / Utah Data Center Approval, Mai 2026; Morgan Stanley Power Shortfall Warning, Mär 2026