KI-InfrastrukturNVIDIAAMDRechenzentrumCompute-Nachfrage

KI-Infrastruktur-Neubewertung: Jensen Huang meldet 1000% Compute-Nachfrage, CPU schlägt zurück

Kael Zhang 24. Mai 2026

Im Mai 2026 wird die Erzählung um KI-Infrastruktur neu geschrieben.

Die letzten zwei Jahre drehte sich die Geschichte um GPUs – wer mehr H100 besaß, hatte das Ticket zur KI-Ära. Doch jetzt hat eine einzige Aussage von NVIDIA-CEO Jensen Huang die Compute-Architektur-Diskussion verändert: “Die für generative KI vor zwei Jahren nötige Rechenleistung ist im Vergleich zu heutiger Agentic AI um eintausend Prozent gestiegen.”

Das ist keine Übertreibung. Das ist der Beginn einer architektonischen Transformation.

Die Geschichte hinter den Zahlen

AMDs Q1-Ergebnis: Datacenter wird zur Kernmaschine

AMDs Datacenter-Umsatz im Q1 2026 erreichte 5,8 Mrd. $, ein Anstieg von 38% gegenüber dem Vorjahr. CEO Lisa Su erklärte unmissverständlich: “Datacenter-Umsätze sind jetzt der Haupttreiber unseres Umsatz- und Ertragswachstums.”

Kritischer ist die Auswirkung von KI-Agenten auf CPU-Nachfrage: Die AMD- und Intel-x86-Industriegruppe kündigte kürzlich den neuen Befehlssatz AI Compute Extensions (ACE) an, um die Leistungslücke zu GPUs zu schließen.

Signalinterpretation: CPUs sind nicht länger GPU-Komparsen – sie erobern ihren Status als First-Class-Citizens für KI-Workloads zurück.

NVIDIAs 1000%-Behauptung: Nicht GPU allein

Jensen Huangs 1000%-Steigerung der Compute-Nachfrage bedeutet nicht, dass GPU-Compute-Anforderungen um das 10-Fache wuchsen. Sie bedeutet die Full-Stack-Compute-Nachfrage – von “eine Antwort generieren” bis hin zu “autonom planen, ausführen, verifizieren und multi-step-Aufgaben iterieren”.

Das bedeutet:

GPU: Bearbeitet weiterhin die Kern-Modell-Inferenz
CPU: Verantwortlich für Agenten-Orchestrierung, Zustandsmanagement, Tool-Ausführung und Multi-Agenten-Koordination
Speicher und Storage: Agenten müssen Kontext über Sitzungen hinweg beibehalten, was die Nachfrage nach persistentem Speicher explodieren lässt

Der UBS-Bericht beschreibt diese Verschiebung präzise: Das CPU-zu-GPU-Verhältnis in Rechenzentren verschiebt sich von 1:4 Richtung 1:1, in manchen Agenten-Konfigurationen sogar auf 4:1 (CPU-dominiert).

Infrastruktur-Neubewertung

Mehrere Institutionen erhöhten in Q1-Q2 2026 gleichzeitig ihre Infrastruktur-TAM-Prognosen:

Institution	Prognose	Umfang	Anpassung
Morgan Stanley	Server-CPU-TAM bis 2030 bei 125 Mrd. $	Nur CPU	+25%
Goldman Sachs	Token-Verbrauch 24x bis 2030	Voller Inferenz-Stack	Neue Prognose
UBS	CPU:GPU-Verhältnis von 1:4 auf 1:1+	Rechenzentrums-Konfiguration	Strukturelle Verschiebung
NVIDIA (Jensen Huang)	1000% Compute-Zuwachs für Agentic AI	Gesamte Compute-Nachfrage	Sprung um eine Größenordnung

Das ist kein lineares Wachstum. Das ist eine Migration des architektonischen Schwerpunkts.

Der generative KI-Ausbau war GPU-dominiert. Der Agentic-AI-Ausbau fügt CPU-, Speicher- und Storage-Bedarf zusätzlich zur bestehenden GPU-Infrastruktur hinzu.

Energiekrise: Die Metapher des 40.000-Acre-Rechenzentrums

Anfang Mai genehmigte Box Elder County, Utah, ein 40.000 Acre großes Hyperscale-Rechenzentrum. Nach Fertigstellung soll es 9 Gigawatt Strom verbrauchen – mehr als doppelt so viel wie der aktuelle Gesamtverbrauch des Bundesstaates (4 Gigawatt).

Das Projekt wird teilweise vom “Shark Tank”-Investor Kevin O’Leary unterstützt.

Was diese Zahl bedeutet:

Morgan Stanley warnte im März, dass die USA bis 2028 einem Stromdefizit von 9-18 Gigawatt gegenüberstehen könnten
Ein einzelnes Projekt mit 9 Gigawatt bedeutet, dass zukünftige Rechenzentrums-Wettbewerbe im Kern Energie-Wettbewerbe sind
Wäre das 1000%ige Compute-Wachstum durch neue GPUs zu tragen, würde das Stromnetz kollabieren

Teil des CPU-Comebacks ist Energieeffizienz. In bestimmten Agenten-Orchestrierungsszenarien übertrifft die Leistung pro Watt der CPU die GPU-Effizienz.

Von generativer KI zu Agentic AI: Architektonische Unterschiede

Dimension	Generative KI	Agentic KI
Kernaufgabe	Einzel-Inferenz: Input→Output	Multi-step-Planung: Ziel→Zerlegung→Ausführung→Verifikation→Iteration
Compute-Muster	GPU-intensiv	GPU+CPU-Hybrid, CPU-Anteil steigt
Speicherbedarf	Innerhalb des Kontextfensters	Sitzungsübergreifende Persistenz, Vektor-Datenbank-Retrieval
Storage-Muster	Modellgewichte + Cache	Agenten-Zustand, Tool-Ergebnisse, Memory-Logs
Latenz-Toleranz	Low-Latency-Priorität	End-to-End-Aufgabenabschlusszeit priorisiert
Fehlerbehandlung	Einzelne Wiederholung	Multi-step-Rollback, alternative Pfade, menschliche Übergabe

Dieser architektonische Unterschied erklärt, warum Agentic AI 10x Compute braucht: Nicht weil einzelne Inferenz teurer wurde, sondern weil Inferenzfrequenz und Koordinationskomplexität explodiert sind.

Auswirkungen auf Technologie-Entscheider

Infrastruktur-Beschaffung

Rolle der CPU in KI-Workloads neu bewerten. Agenten-Orchestrierung, Zustandsmanagement und Tool-Ausführung sind Kerndomänen der CPU
Speicher- und Storage-Upgrade-Zyklen berücksichtigen. Persistenter Memory-Bedarf von Agenten kann GPU-Compute-Bedarf überholen

Kostenmodellierung

Generative KI: Kosten pro Token. Agentic AI: Kosten pro Aufgabenabschluss, inklusive mehrerer Inferenz-Aufrufe, Tool-Invocationen und Zustands-Persistenz
Neue Kostenschätzungs-Frameworks nötig; aktuelle Inferenzkosten nicht linear extrapolierbar

Energiestrategie

Strom wird zur harten Beschränkung für Rechenzentren. CPU-Energieeffizienz-Vorteil in bestimmten Agenten-Szenarien kann Standort- und Architekturentscheidungen beeinflussen
Heterogenes Computing berücksichtigen: GPU für Inferenz, CPU für Orchestrierung, dedizierte Beschleuniger für spezifische Tools (z.B. Retrieval, Verifikation)

Kernfazit

KI-Infrastruktur durchläuft einen Paradigmenwechsel vom “GPU-Zentralismus” hin zur “Heterogenen-Computing-Balance”.

Jensen Huangs 1000% sind keine Marketingzahl. Sie spiegeln eine architektonische Tatsache wider: Agentic AI ist kein “besserer Chatbot”, sondern ein “Workflow-System, das in der Lage ist, komplexe Aufgaben autonom auszuführen”. Solche Systeme sind koordinationsintensiv, nicht nur inferenzintensiv.

AMDs 38% Datacenter-Umsatzwachstum, Morgan Stanleys angehobene CPU-Marktprognose, UBS’ beobachtetes CPU:GPU-Verhältnis-Umkehren – diese unabhängigen Signale zeigen alle in dieselbe Richtung: CPUs erobern Terrain in der KI-Infrastruktur zurück.

Zukünftige KI-Rechenzentren werden keine bloßen “GPU-Farmen” sein. Sie sind heterogene Compute-Cluster, in denen CPU, GPU, Speicher, Storage und Netzwerk in neuem Gleichgewicht rekonfiguriert werden, um autonomen Agenten-Betrieb zu unterstützen.

Strom ist die ultimative harte Beschränkung. Das 40.000-Acre-, 9-Gigawatt-Utah-Projekt ist eine Warnung: Die Spannung zwischen exponentiellem Compute-Wachstum und linearem Stromangebot wird die KI-Infrastruktur der nächsten Dekade definieren.

Quellen: AMD Q1 2026 Earnings; NVIDIA GTC 2026 / Jensen Huang Statements, Mai 2026; Morgan Stanley Infrastructure TAM Revision, Q1-Q2 2026; UBS Data Center Configuration Report, 2026; Goldman Sachs Token Consumption Projection, Mai 2026; The Salt Lake Tribune / Utah Data Center Approval, Mai 2026; Morgan Stanley Power Shortfall Warning, Mär 2026