Kael Zhang
AMDAI Developer DayLisa SuAgent IACPUGPUCalculCentre de Données

AMD AI Developer Day pour la première fois en Chine : Lisa Su mise sur les agents, ratio CPU-GPU à 1:1

Kael Zhang

Le 19 mai, AMD a organisé son premier AI Developer Day en Chine — la première fois dans l’histoire que cet événement quitte le sol américain.

Dans la salle, les spectateurs sans siège s’alignaient le long des murs rangée après rangée. Le keynote de la présidente et PDG d’AMD Lisa Su se résume à deux choses : les agents et le retour du CPU.


Deux jugements critiques

Jugement un : Les CPU deviennent plus critiques que jamais

Su a livré les chiffres directement :

Dans les centres de données traditionnels, le ratio CPU/GPU est de 1:4. D’ici 2026, ce ratio deviendra 1:1.

Qu’est-ce que cela signifie ?

Depuis dix ans, les récits sur la puissance de calcul IA ont été monopolisés par les GPU. L’entraînement de grands modèles nécessite CUDA ; l’accélération de l’inférence dépend des Tensor Cores. Les CPU ont été marginalisés comme des “plans de contrôle” — donnant des ordres sans participer au calcul principal.

Le jugement de Su : à l’ère des agents, les charges de calcul évoluent.

Le ratio 1:1 n’est pas une prédiction ; c’est une déclaration. AMD utilise son portefeuille de processeurs EPYC pour reconquérir le discours sur les centres de données.


Jugement deux : La Chine est un riche gisement de demande de calcul

Déplacer la conférence des développeurs en Chine n’est pas du marketing — c’est un positionnement stratégique.

La vitesse de déploiement des applications IA en Chine, la densité d’adoption des agents en entreprise et le volume d’achat de puissance de calcul se classent tous dans la première ligne mondiale. Le sous-texte de Su sur scène était clair : si vous ne pouvez pas gagner les développeurs en Chine, vous ne pouvez pas gagner la guerre de l’infrastructure IA au niveau mondial.

Les défis actuels d’AMD :

Mais les atouts d’AMD sont également clairs :


Ce que les agents changent

Les agents ne sont pas de “meilleurs chatbots”. Leurs caractéristiques techniques entraînent des changements d’architecture sous-jacents :

CaractéristiqueImpact sur le calcul
Tâches multi-étapesGestion d’état persistante requise ; charge de planification CPU accrue
Appels d’outilsI/O fréquentes ; bande passante mémoire et latence sensibles
Contexte longGonflement du cache KV ; la capacité mémoire devient une contrainte dure
Entrée multimodalePipelines de prétraitement complexes ; demande de calcul hétérogène en hausse
Décisions en temps réelInférence à faible latence ; ne peut pas passer par le pipeline GPU complet à chaque fois

Ces caractéristiques pointent collectivement vers une conclusion : l’infrastructure IA passe de la “force brute GPU mono-machine” à “l’architecture fine collaborative CPU+GPU”.

AMD détient à la fois EPYC et Instinct — c’est ce qui lui donne la confiance nécessaire pour déclarer 1:1.


Paysage concurrentiel : Impasse à trois

FournisseurAvantage CPUAvantage GPUÉcosystème
NVIDIAFaible (Grace pas encore largement déployé)Dominant (écosystème CUDA)Fermé mais mature
AMDFort (EPYC)Modéré (ROCm rattrape)Voie open-source
IntelModéré (part de marché Xeon en déclin)Faible (Gaudi traction limitée)Promotion oneAPI en cours

La stratégie d’AMD est explicite : tirer parti de la base installée CPU pour entraîner la pénétration incrémentale GPU. Les agents sont le point d’entrée parfait — car dans ce scénario, le CPU n’est plus un acteur de soutien.


Impact pratique pour les développeurs

Si vous êtes un développeur d’applications IA, qu’est-ce que cela signifie ?

  1. La programmation hétérogène devient la norme. Les compétences CUDA pures perdent de la valeur ; les ingénieurs capables de répartir les charges entre CPU et GPU sont plus rares
  2. L’optimisation de l’inférence vaut plus que l’optimisation de l’entraînement. À l’ère des agents, 90% de la consommation de calcul concerne l’inférence et la planification, pas l’entraînement
  3. Le risque de verrouillage matériel doit être couvert. ROCm, oneAPI et CUDA coexisteront pendant des années. Ne verrouillez pas votre code sur une seule plateforme

Conclusion

Le fait qu’AMD déplace son AI Developer Day en Chine est à la fois un signal et un pari.

Le signal : à l’ère des agents, l’architecture de calcul est en train d’être refaçonnée, et les CPU ne sont plus des accessoires des GPU.

Le pari : ROCm peut-il, à l’ombre de CUDA, utiliser le vent arrière des agents pour percer sur le plan de l’écosystème ?

Su n’a pas répondu directement à cette question. Mais le fait de déplacer la conférence en Chine est en soi la réponse — la demande ici est suffisamment importante pour redéfinir les règles.