Recalcul des Infrastructures IA : Jensen Huang Annonce une Hausse de 1000% de la Demande de Calcul, le CPU Frappe un Grand Coup
En mai 2026, le récit autour des infrastructures d’intelligence artificielle est en train d’être réécrit.
Ces deux dernières années, l’histoire tournait autour des GPU — celui qui possédait le plus de H100 détenait le billet pour l’ère de l’IA. Mais aujourd’hui, une seule déclaration du PDG de NVIDIA Jensen Huang a déplacé la conversation sur l’architecture de calcul : “La quantité de calcul nécessaire pour l’IA générative il y a deux ans comparée à l’IA agentique aujourd’hui a augmenté de mille pour cent.”
Ce n’est pas de l’exagération. C’est le début d’une transformation architecturale.
L’Histoire Derrière les Chiffres
Résultats Q1 d’AMD : Le Datacenter Devient le Moteur Principal
Les ventes datacenter d’AMD au premier trimestre 2026 ont atteint 5,8 milliards de dollars, soit une augmentation de 38% en glissement annuel. La PDG Lisa Su a clairement déclaré : “Les ventes datacenter sont désormais le principal moteur de notre croissance de revenus et de bénéfices.”
Plus critique encore, les agents IA stimulent la demande de CPU : le groupe industriel x86 d’AMD et Intel a récemment annoncé un nouveau jeu d’instructions, AI Compute Extensions (ACE), visant à combler l’écart de performance avec les GPU.
Interprétation du signal : Les CPU ne sont plus les faire-valoir des GPU — ils reconquièrent leur statut de citoyens de première classe pour les charges de travail IA.
La Déclaration de 1000% de NVIDIA : Pas Seulement le GPU
La hausse de 1000% de la demande de calcul annoncée par Jensen Huang ne signifie pas que les besoins en calcul GPU ont été multipliés par dix. Elle signifie la demande de calcul full-stack — de “générer une réponse” à “planifier, exécuter, vérifier et itérer de manière autonome des tâches multi-étapes”.
Cela signifie :
- GPU : Gère toujours le calcul d’inférence du modèle central
- CPU : Responsable de l’orchestration des agents, de la gestion des états, de l’exécution des outils et de la coordination multi-agents
- Mémoire et Stockage : Les agents doivent maintenir le contexte entre les sessions, ce qui fait exploser la demande de mémoire persistante
Le rapport d’UBS décrit précisément ce changement : le ratio CPU/GPU dans les datacenters passe de 1:4 à 1:1, et dans certaines configurations d’agents atteint 4:1 (dominé par le CPU).
Recalcul des Infrastructures
Plusieurs institutions ont simultanément relevé leurs prévisions TAM d’infrastructure au premier et deuxième trimestre 2026 :
| Institution | Prévision | Portée | Ajustement |
|---|---|---|---|
| Morgan Stanley | TAM CPU serveur à 125 Mds $ d’ici 2030 | CPU uniquement | +25% |
| Goldman Sachs | Consommation de tokens ×24 d’ici 2030 | Pile d’inférence complète | Nouvelle prévision |
| UBS | Ratio CPU/GPU passant de 1:4 à 1:1+ | Configuration datacenter | Changement structurel |
| NVIDIA (Jensen Huang) | Hausse de 1000% du calcul pour l’IA agentique | Demande de calcul totale | Bond d’un ordre de grandeur |
Ce n’est pas une croissance linéaire. C’est une migration du centre de gravité architectural.
Le déploiement de l’IA générative était dominé par les GPU. Le déploiement de l’IA agentique ajoute des besoins en CPU, mémoire et stockage en plus de l’infrastructure GPU existante.
Crise Énergétique : La Métaphore du Datacenter de 40 000 Acres
Début mai, le comté de Box Elder dans l’Utah a approuvé un projet de datacenter hyperscale de 40 000 acres. Une fois achevé, il devrait consommer 9 gigawatts d’électricité — plus du double de la consommation totale actuelle de l’État (4 gigawatts).
Le projet est partiellement soutenu par l’investisseur de “Shark Tank” Kevin O’Leary.
Ce que ce chiffre signifie :
- Morgan Stanley avait averti en mars que les États-Unis pourraient faire face à un déficit de 9 à 18 gigawatts d’ici 2028
- Un projet unique consommant 9 gigawatts signifie que la concurrence des datacenters futurs est fondamentalement une concurrence énergétique
- Si la croissance de 1000% de la demande de calcul de l’IA agentique devait être entièrement supportée par de nouveaux GPU, le réseau électrique s’effondrerait
Une partie du retour en grâce du CPU est son efficacité énergétique. Dans certains scénarios d’orchestration d’agents, l’efficacité performance-par-watt du CPU dépasse celle du GPU.
De l’IA Générative à l’IA Agentique : Différences Architecturales
| Dimension | IA Générative | IA Agentique |
|---|---|---|
| Tâche Principale | Inférence unique : entrée → sortie | Planification multi-étapes : objectif → décomposition → exécution → vérification → itération |
| Modèle de Calcul | Intensif en GPU | Hybride GPU+CPU, part CPU croissante |
| Besoins Mémoire | Dans la fenêtre de contexte | Persistance inter-sessions, récupération en base de données vectorielle |
| Modèle de Stockage | Poids du modèle + cache | État de l’agent, résultats des outils, journaux de mémoire |
| Tolérance Latence | Priorité faible latence | Priorité temps d’achèvement de tâche end-to-end |
| Gestion des Échecs | Nouvelle tentative unique | Rollback multi-étapes, chemins alternatifs, remise à l’humain |
Cette différence architecturale explique pourquoi l’IA agentique a besoin de 10 fois plus de calcul : non pas parce que l’inférence unique est devenue plus chère, mais parce que la fréquence d’inférence et la complexité de coordination ont explosé.
Impact sur les Décideurs Technologiques
Approvisionnement en Infrastructure
- Réévaluer le rôle du CPU dans les charges de travail IA. L’orchestration des agents, la gestion des états et l’exécution des outils sont les domaines de compétence principaux du CPU
- Considérer les cycles de mise à niveau mémoire et stockage. Les besoins en mémoire persistante des agents peuvent dépasser la demande de calcul GPU
Modélisation des Coûts
- Modèle de coûts de l’IA générative : facturation par token. Modèle de coûts de l’IA agentique : facturation par achèvement de tâche, incluant multiples appels d’inférence, invocations d’outils et persistance d’état
- Nouveaux cadres d’estimation des coûts nécessaires ; impossible de simplement extrapoler linéairement les coûts d’inférence actuels
Stratégie Énergétique
- L’électricité devient une contrainte dure pour les datacenters. L’avantage d’efficacité énergétique du CPU dans certains scénarios d’agents peut devenir un facteur clé dans les décisions de localisation et d’architecture
- Considérer l’informatique hétérogène : GPU pour l’inférence, CPU pour l’orchestration, accélérateurs dédiés pour des outils spécifiques (par ex. récupération, vérification)
Conclusion Clé
L’infrastructure d’intelligence artificielle traverse un changement de paradigme du “GPU-centrisme” vers un “équilibre de calcul hétérogène”.
Les 1000% de Jensen Huang ne sont pas un chiffre marketing. Ils reflètent une réalité architecturale : l’IA agentique n’est pas un “meilleur chatbot” mais un “système de flux de travail capable d’exécuter de manière autonome des tâches complexes”. De tels systèmes sont intensifs en coordination, pas seulement en inférence.
La croissance de 38% des revenus datacenter d’AMD, la prévision de marché CPU relevée de Morgan Stanley, l’inversion du ratio CPU/GPU observée par UBS — ces signaux indépendants pointent tous dans la même direction : les CPU reconquièrent du terrain dans l’infrastructure IA.
Les futurs datacenters d’IA ne seront pas de simples “fermes de GPU”. Ce sont des clusters de calcul hétérogènes où CPU, GPU, mémoire, stockage et réseau sont reconfigurés dans un nouvel équilibre pour supporter le fonctionnement autonome des agents.
L’énergie est la contrainte dure ultime. Le projet de 40 000 acres et 9 gigawatts en Utah est un avertissement : la tension entre la croissance exponentielle de la demande de calcul et la croissance linéaire de l’offre d’électricité définira l’infrastructure IA pour la décennie à venir.
Sources : AMD Q1 2026 Earnings ; NVIDIA GTC 2026 / Jensen Huang Statements, mai 2026 ; Morgan Stanley Infrastructure TAM Revision, Q1-Q2 2026 ; UBS Data Center Configuration Report, 2026 ; Goldman Sachs Token Consumption Projection, mai 2026 ; The Salt Lake Tribune / Utah Data Center Approval, mai 2026 ; Morgan Stanley Power Shortfall Warning, mars 2026