AMDAI Developer DayLisa SuAgent IACPUGPUCalculCentre de Données

AMD AI Developer Day pour la première fois en Chine : Lisa Su mise sur les agents, ratio CPU-GPU à 1:1

Kael Zhang 21 mai 2026

Le 19 mai, AMD a organisé son premier AI Developer Day en Chine — la première fois dans l’histoire que cet événement quitte le sol américain.

Dans la salle, les spectateurs sans siège s’alignaient le long des murs rangée après rangée. Le keynote de la présidente et PDG d’AMD Lisa Su se résume à deux choses : les agents et le retour du CPU.

Deux jugements critiques

Jugement un : Les CPU deviennent plus critiques que jamais

Su a livré les chiffres directement :

Dans les centres de données traditionnels, le ratio CPU/GPU est de 1:4. D’ici 2026, ce ratio deviendra 1:1.

Qu’est-ce que cela signifie ?

Depuis dix ans, les récits sur la puissance de calcul IA ont été monopolisés par les GPU. L’entraînement de grands modèles nécessite CUDA ; l’accélération de l’inférence dépend des Tensor Cores. Les CPU ont été marginalisés comme des “plans de contrôle” — donnant des ordres sans participer au calcul principal.

Le jugement de Su : à l’ère des agents, les charges de calcul évoluent.

Les agents ne sont pas une inférence unique ; ce sont des flux de tâches multi-étapes à long terme
Chaque étape nécessite de la planification, de la prise de décision et de la gestion d’état — les CPU excellent dans ces domaines
Lorsque les GPU traitent le calcul parallèle, les CPU coordonnent en série. Les deux sont indispensables

Le ratio 1:1 n’est pas une prédiction ; c’est une déclaration. AMD utilise son portefeuille de processeurs EPYC pour reconquérir le discours sur les centres de données.

Jugement deux : La Chine est un riche gisement de demande de calcul

Déplacer la conférence des développeurs en Chine n’est pas du marketing — c’est un positionnement stratégique.

La vitesse de déploiement des applications IA en Chine, la densité d’adoption des agents en entreprise et le volume d’achat de puissance de calcul se classent tous dans la première ligne mondiale. Le sous-texte de Su sur scène était clair : si vous ne pouvez pas gagner les développeurs en Chine, vous ne pouvez pas gagner la guerre de l’infrastructure IA au niveau mondial.

Les défis actuels d’AMD :

Le fossé de l’écosystème CUDA reste profond
La maturité de ROCm est encore en retard sur nvcc + cuDNN
Les coûts de migration des développeurs sont réels

Mais les atouts d’AMD sont également clairs :

La part de marché d’EPYC dans les CPU pour centres de données continue de grimper
Les GPU de la série MI offrent des avantages coût-performance pour l’inférence
La voie open-source attire les grandes entreprises cherchant à éviter le verrouillage par un fournisseur unique

Ce que les agents changent

Les agents ne sont pas de “meilleurs chatbots”. Leurs caractéristiques techniques entraînent des changements d’architecture sous-jacents :

Caractéristique	Impact sur le calcul
Tâches multi-étapes	Gestion d’état persistante requise ; charge de planification CPU accrue
Appels d’outils	I/O fréquentes ; bande passante mémoire et latence sensibles
Contexte long	Gonflement du cache KV ; la capacité mémoire devient une contrainte dure
Entrée multimodale	Pipelines de prétraitement complexes ; demande de calcul hétérogène en hausse
Décisions en temps réel	Inférence à faible latence ; ne peut pas passer par le pipeline GPU complet à chaque fois

Ces caractéristiques pointent collectivement vers une conclusion : l’infrastructure IA passe de la “force brute GPU mono-machine” à “l’architecture fine collaborative CPU+GPU”.

AMD détient à la fois EPYC et Instinct — c’est ce qui lui donne la confiance nécessaire pour déclarer 1:1.

Paysage concurrentiel : Impasse à trois

Fournisseur	Avantage CPU	Avantage GPU	Écosystème
NVIDIA	Faible (Grace pas encore largement déployé)	Dominant (écosystème CUDA)	Fermé mais mature
AMD	Fort (EPYC)	Modéré (ROCm rattrape)	Voie open-source
Intel	Modéré (part de marché Xeon en déclin)	Faible (Gaudi traction limitée)	Promotion oneAPI en cours

La stratégie d’AMD est explicite : tirer parti de la base installée CPU pour entraîner la pénétration incrémentale GPU. Les agents sont le point d’entrée parfait — car dans ce scénario, le CPU n’est plus un acteur de soutien.

Impact pratique pour les développeurs

Si vous êtes un développeur d’applications IA, qu’est-ce que cela signifie ?

La programmation hétérogène devient la norme. Les compétences CUDA pures perdent de la valeur ; les ingénieurs capables de répartir les charges entre CPU et GPU sont plus rares
L’optimisation de l’inférence vaut plus que l’optimisation de l’entraînement. À l’ère des agents, 90% de la consommation de calcul concerne l’inférence et la planification, pas l’entraînement
Le risque de verrouillage matériel doit être couvert. ROCm, oneAPI et CUDA coexisteront pendant des années. Ne verrouillez pas votre code sur une seule plateforme

Conclusion

Le fait qu’AMD déplace son AI Developer Day en Chine est à la fois un signal et un pari.

Le signal : à l’ère des agents, l’architecture de calcul est en train d’être refaçonnée, et les CPU ne sont plus des accessoires des GPU.

Le pari : ROCm peut-il, à l’ombre de CUDA, utiliser le vent arrière des agents pour percer sur le plan de l’écosystème ?

Su n’a pas répondu directement à cette question. Mais le fait de déplacer la conférence en Chine est en soi la réponse — la demande ici est suffisamment importante pour redéfinir les règles.