Kael Zhang
Infrastructure IANVIDIAAMDDatacenterDemande de Calcul

Recalcul des Infrastructures IA : Jensen Huang Annonce une Hausse de 1000% de la Demande de Calcul, le CPU Frappe un Grand Coup

Kael Zhang

En mai 2026, le récit autour des infrastructures d’intelligence artificielle est en train d’être réécrit.

Ces deux dernières années, l’histoire tournait autour des GPU — celui qui possédait le plus de H100 détenait le billet pour l’ère de l’IA. Mais aujourd’hui, une seule déclaration du PDG de NVIDIA Jensen Huang a déplacé la conversation sur l’architecture de calcul : “La quantité de calcul nécessaire pour l’IA générative il y a deux ans comparée à l’IA agentique aujourd’hui a augmenté de mille pour cent.”

Ce n’est pas de l’exagération. C’est le début d’une transformation architecturale.


L’Histoire Derrière les Chiffres

Résultats Q1 d’AMD : Le Datacenter Devient le Moteur Principal

Les ventes datacenter d’AMD au premier trimestre 2026 ont atteint 5,8 milliards de dollars, soit une augmentation de 38% en glissement annuel. La PDG Lisa Su a clairement déclaré : “Les ventes datacenter sont désormais le principal moteur de notre croissance de revenus et de bénéfices.”

Plus critique encore, les agents IA stimulent la demande de CPU : le groupe industriel x86 d’AMD et Intel a récemment annoncé un nouveau jeu d’instructions, AI Compute Extensions (ACE), visant à combler l’écart de performance avec les GPU.

Interprétation du signal : Les CPU ne sont plus les faire-valoir des GPU — ils reconquièrent leur statut de citoyens de première classe pour les charges de travail IA.

La Déclaration de 1000% de NVIDIA : Pas Seulement le GPU

La hausse de 1000% de la demande de calcul annoncée par Jensen Huang ne signifie pas que les besoins en calcul GPU ont été multipliés par dix. Elle signifie la demande de calcul full-stack — de “générer une réponse” à “planifier, exécuter, vérifier et itérer de manière autonome des tâches multi-étapes”.

Cela signifie :

Le rapport d’UBS décrit précisément ce changement : le ratio CPU/GPU dans les datacenters passe de 1:4 à 1:1, et dans certaines configurations d’agents atteint 4:1 (dominé par le CPU).


Recalcul des Infrastructures

Plusieurs institutions ont simultanément relevé leurs prévisions TAM d’infrastructure au premier et deuxième trimestre 2026 :

InstitutionPrévisionPortéeAjustement
Morgan StanleyTAM CPU serveur à 125 Mds $ d’ici 2030CPU uniquement+25%
Goldman SachsConsommation de tokens ×24 d’ici 2030Pile d’inférence complèteNouvelle prévision
UBSRatio CPU/GPU passant de 1:4 à 1:1+Configuration datacenterChangement structurel
NVIDIA (Jensen Huang)Hausse de 1000% du calcul pour l’IA agentiqueDemande de calcul totaleBond d’un ordre de grandeur

Ce n’est pas une croissance linéaire. C’est une migration du centre de gravité architectural.

Le déploiement de l’IA générative était dominé par les GPU. Le déploiement de l’IA agentique ajoute des besoins en CPU, mémoire et stockage en plus de l’infrastructure GPU existante.


Crise Énergétique : La Métaphore du Datacenter de 40 000 Acres

Début mai, le comté de Box Elder dans l’Utah a approuvé un projet de datacenter hyperscale de 40 000 acres. Une fois achevé, il devrait consommer 9 gigawatts d’électricité — plus du double de la consommation totale actuelle de l’État (4 gigawatts).

Le projet est partiellement soutenu par l’investisseur de “Shark Tank” Kevin O’Leary.

Ce que ce chiffre signifie :

Une partie du retour en grâce du CPU est son efficacité énergétique. Dans certains scénarios d’orchestration d’agents, l’efficacité performance-par-watt du CPU dépasse celle du GPU.


De l’IA Générative à l’IA Agentique : Différences Architecturales

DimensionIA GénérativeIA Agentique
Tâche PrincipaleInférence unique : entrée → sortiePlanification multi-étapes : objectif → décomposition → exécution → vérification → itération
Modèle de CalculIntensif en GPUHybride GPU+CPU, part CPU croissante
Besoins MémoireDans la fenêtre de contextePersistance inter-sessions, récupération en base de données vectorielle
Modèle de StockagePoids du modèle + cacheÉtat de l’agent, résultats des outils, journaux de mémoire
Tolérance LatencePriorité faible latencePriorité temps d’achèvement de tâche end-to-end
Gestion des ÉchecsNouvelle tentative uniqueRollback multi-étapes, chemins alternatifs, remise à l’humain

Cette différence architecturale explique pourquoi l’IA agentique a besoin de 10 fois plus de calcul : non pas parce que l’inférence unique est devenue plus chère, mais parce que la fréquence d’inférence et la complexité de coordination ont explosé.


Impact sur les Décideurs Technologiques

Approvisionnement en Infrastructure

Modélisation des Coûts

Stratégie Énergétique


Conclusion Clé

L’infrastructure d’intelligence artificielle traverse un changement de paradigme du “GPU-centrisme” vers un “équilibre de calcul hétérogène”.

Les 1000% de Jensen Huang ne sont pas un chiffre marketing. Ils reflètent une réalité architecturale : l’IA agentique n’est pas un “meilleur chatbot” mais un “système de flux de travail capable d’exécuter de manière autonome des tâches complexes”. De tels systèmes sont intensifs en coordination, pas seulement en inférence.

La croissance de 38% des revenus datacenter d’AMD, la prévision de marché CPU relevée de Morgan Stanley, l’inversion du ratio CPU/GPU observée par UBS — ces signaux indépendants pointent tous dans la même direction : les CPU reconquièrent du terrain dans l’infrastructure IA.

Les futurs datacenters d’IA ne seront pas de simples “fermes de GPU”. Ce sont des clusters de calcul hétérogènes où CPU, GPU, mémoire, stockage et réseau sont reconfigurés dans un nouvel équilibre pour supporter le fonctionnement autonome des agents.

L’énergie est la contrainte dure ultime. Le projet de 40 000 acres et 9 gigawatts en Utah est un avertissement : la tension entre la croissance exponentielle de la demande de calcul et la croissance linéaire de l’offre d’électricité définira l’infrastructure IA pour la décennie à venir.


Sources : AMD Q1 2026 Earnings ; NVIDIA GTC 2026 / Jensen Huang Statements, mai 2026 ; Morgan Stanley Infrastructure TAM Revision, Q1-Q2 2026 ; UBS Data Center Configuration Report, 2026 ; Goldman Sachs Token Consumption Projection, mai 2026 ; The Salt Lake Tribune / Utah Data Center Approval, mai 2026 ; Morgan Stanley Power Shortfall Warning, mars 2026