Infrastructure IANVIDIAAMDDatacenterDemande de Calcul

Recalcul des Infrastructures IA : Jensen Huang Annonce une Hausse de 1000% de la Demande de Calcul, le CPU Frappe un Grand Coup

Kael Zhang 24 mai 2026

En mai 2026, le récit autour des infrastructures d’intelligence artificielle est en train d’être réécrit.

Ces deux dernières années, l’histoire tournait autour des GPU — celui qui possédait le plus de H100 détenait le billet pour l’ère de l’IA. Mais aujourd’hui, une seule déclaration du PDG de NVIDIA Jensen Huang a déplacé la conversation sur l’architecture de calcul : “La quantité de calcul nécessaire pour l’IA générative il y a deux ans comparée à l’IA agentique aujourd’hui a augmenté de mille pour cent.”

Ce n’est pas de l’exagération. C’est le début d’une transformation architecturale.

L’Histoire Derrière les Chiffres

Résultats Q1 d’AMD : Le Datacenter Devient le Moteur Principal

Les ventes datacenter d’AMD au premier trimestre 2026 ont atteint 5,8 milliards de dollars, soit une augmentation de 38% en glissement annuel. La PDG Lisa Su a clairement déclaré : “Les ventes datacenter sont désormais le principal moteur de notre croissance de revenus et de bénéfices.”

Plus critique encore, les agents IA stimulent la demande de CPU : le groupe industriel x86 d’AMD et Intel a récemment annoncé un nouveau jeu d’instructions, AI Compute Extensions (ACE), visant à combler l’écart de performance avec les GPU.

Interprétation du signal : Les CPU ne sont plus les faire-valoir des GPU — ils reconquièrent leur statut de citoyens de première classe pour les charges de travail IA.

La Déclaration de 1000% de NVIDIA : Pas Seulement le GPU

La hausse de 1000% de la demande de calcul annoncée par Jensen Huang ne signifie pas que les besoins en calcul GPU ont été multipliés par dix. Elle signifie la demande de calcul full-stack — de “générer une réponse” à “planifier, exécuter, vérifier et itérer de manière autonome des tâches multi-étapes”.

Cela signifie :

GPU : Gère toujours le calcul d’inférence du modèle central
CPU : Responsable de l’orchestration des agents, de la gestion des états, de l’exécution des outils et de la coordination multi-agents
Mémoire et Stockage : Les agents doivent maintenir le contexte entre les sessions, ce qui fait exploser la demande de mémoire persistante

Le rapport d’UBS décrit précisément ce changement : le ratio CPU/GPU dans les datacenters passe de 1:4 à 1:1, et dans certaines configurations d’agents atteint 4:1 (dominé par le CPU).

Recalcul des Infrastructures

Plusieurs institutions ont simultanément relevé leurs prévisions TAM d’infrastructure au premier et deuxième trimestre 2026 :

Institution	Prévision	Portée	Ajustement
Morgan Stanley	TAM CPU serveur à 125 Mds $ d’ici 2030	CPU uniquement	+25%
Goldman Sachs	Consommation de tokens ×24 d’ici 2030	Pile d’inférence complète	Nouvelle prévision
UBS	Ratio CPU/GPU passant de 1:4 à 1:1+	Configuration datacenter	Changement structurel
NVIDIA (Jensen Huang)	Hausse de 1000% du calcul pour l’IA agentique	Demande de calcul totale	Bond d’un ordre de grandeur

Ce n’est pas une croissance linéaire. C’est une migration du centre de gravité architectural.

Le déploiement de l’IA générative était dominé par les GPU. Le déploiement de l’IA agentique ajoute des besoins en CPU, mémoire et stockage en plus de l’infrastructure GPU existante.

Crise Énergétique : La Métaphore du Datacenter de 40 000 Acres

Début mai, le comté de Box Elder dans l’Utah a approuvé un projet de datacenter hyperscale de 40 000 acres. Une fois achevé, il devrait consommer 9 gigawatts d’électricité — plus du double de la consommation totale actuelle de l’État (4 gigawatts).

Le projet est partiellement soutenu par l’investisseur de “Shark Tank” Kevin O’Leary.

Ce que ce chiffre signifie :

Morgan Stanley avait averti en mars que les États-Unis pourraient faire face à un déficit de 9 à 18 gigawatts d’ici 2028
Un projet unique consommant 9 gigawatts signifie que la concurrence des datacenters futurs est fondamentalement une concurrence énergétique
Si la croissance de 1000% de la demande de calcul de l’IA agentique devait être entièrement supportée par de nouveaux GPU, le réseau électrique s’effondrerait

Une partie du retour en grâce du CPU est son efficacité énergétique. Dans certains scénarios d’orchestration d’agents, l’efficacité performance-par-watt du CPU dépasse celle du GPU.

De l’IA Générative à l’IA Agentique : Différences Architecturales

Dimension	IA Générative	IA Agentique
Tâche Principale	Inférence unique : entrée → sortie	Planification multi-étapes : objectif → décomposition → exécution → vérification → itération
Modèle de Calcul	Intensif en GPU	Hybride GPU+CPU, part CPU croissante
Besoins Mémoire	Dans la fenêtre de contexte	Persistance inter-sessions, récupération en base de données vectorielle
Modèle de Stockage	Poids du modèle + cache	État de l’agent, résultats des outils, journaux de mémoire
Tolérance Latence	Priorité faible latence	Priorité temps d’achèvement de tâche end-to-end
Gestion des Échecs	Nouvelle tentative unique	Rollback multi-étapes, chemins alternatifs, remise à l’humain

Cette différence architecturale explique pourquoi l’IA agentique a besoin de 10 fois plus de calcul : non pas parce que l’inférence unique est devenue plus chère, mais parce que la fréquence d’inférence et la complexité de coordination ont explosé.

Impact sur les Décideurs Technologiques

Approvisionnement en Infrastructure

Réévaluer le rôle du CPU dans les charges de travail IA. L’orchestration des agents, la gestion des états et l’exécution des outils sont les domaines de compétence principaux du CPU
Considérer les cycles de mise à niveau mémoire et stockage. Les besoins en mémoire persistante des agents peuvent dépasser la demande de calcul GPU

Modélisation des Coûts

Modèle de coûts de l’IA générative : facturation par token. Modèle de coûts de l’IA agentique : facturation par achèvement de tâche, incluant multiples appels d’inférence, invocations d’outils et persistance d’état
Nouveaux cadres d’estimation des coûts nécessaires ; impossible de simplement extrapoler linéairement les coûts d’inférence actuels

Stratégie Énergétique

L’électricité devient une contrainte dure pour les datacenters. L’avantage d’efficacité énergétique du CPU dans certains scénarios d’agents peut devenir un facteur clé dans les décisions de localisation et d’architecture
Considérer l’informatique hétérogène : GPU pour l’inférence, CPU pour l’orchestration, accélérateurs dédiés pour des outils spécifiques (par ex. récupération, vérification)

Conclusion Clé

L’infrastructure d’intelligence artificielle traverse un changement de paradigme du “GPU-centrisme” vers un “équilibre de calcul hétérogène”.

Les 1000% de Jensen Huang ne sont pas un chiffre marketing. Ils reflètent une réalité architecturale : l’IA agentique n’est pas un “meilleur chatbot” mais un “système de flux de travail capable d’exécuter de manière autonome des tâches complexes”. De tels systèmes sont intensifs en coordination, pas seulement en inférence.

La croissance de 38% des revenus datacenter d’AMD, la prévision de marché CPU relevée de Morgan Stanley, l’inversion du ratio CPU/GPU observée par UBS — ces signaux indépendants pointent tous dans la même direction : les CPU reconquièrent du terrain dans l’infrastructure IA.

Les futurs datacenters d’IA ne seront pas de simples “fermes de GPU”. Ce sont des clusters de calcul hétérogènes où CPU, GPU, mémoire, stockage et réseau sont reconfigurés dans un nouvel équilibre pour supporter le fonctionnement autonome des agents.

L’énergie est la contrainte dure ultime. Le projet de 40 000 acres et 9 gigawatts en Utah est un avertissement : la tension entre la croissance exponentielle de la demande de calcul et la croissance linéaire de l’offre d’électricité définira l’infrastructure IA pour la décennie à venir.

Sources : AMD Q1 2026 Earnings ; NVIDIA GTC 2026 / Jensen Huang Statements, mai 2026 ; Morgan Stanley Infrastructure TAM Revision, Q1-Q2 2026 ; UBS Data Center Configuration Report, 2026 ; Goldman Sachs Token Consumption Projection, mai 2026 ; The Salt Lake Tribune / Utah Data Center Approval, mai 2026 ; Morgan Stanley Power Shortfall Warning, mars 2026