AMD AI Developer Day pour la première fois en Chine : Lisa Su mise sur les agents, ratio CPU-GPU à 1:1
Le 19 mai, AMD a organisé son premier AI Developer Day en Chine — la première fois dans l’histoire que cet événement quitte le sol américain.
Dans la salle, les spectateurs sans siège s’alignaient le long des murs rangée après rangée. Le keynote de la présidente et PDG d’AMD Lisa Su se résume à deux choses : les agents et le retour du CPU.
Deux jugements critiques
Jugement un : Les CPU deviennent plus critiques que jamais
Su a livré les chiffres directement :
Dans les centres de données traditionnels, le ratio CPU/GPU est de 1:4. D’ici 2026, ce ratio deviendra 1:1.
Qu’est-ce que cela signifie ?
Depuis dix ans, les récits sur la puissance de calcul IA ont été monopolisés par les GPU. L’entraînement de grands modèles nécessite CUDA ; l’accélération de l’inférence dépend des Tensor Cores. Les CPU ont été marginalisés comme des “plans de contrôle” — donnant des ordres sans participer au calcul principal.
Le jugement de Su : à l’ère des agents, les charges de calcul évoluent.
- Les agents ne sont pas une inférence unique ; ce sont des flux de tâches multi-étapes à long terme
- Chaque étape nécessite de la planification, de la prise de décision et de la gestion d’état — les CPU excellent dans ces domaines
- Lorsque les GPU traitent le calcul parallèle, les CPU coordonnent en série. Les deux sont indispensables
Le ratio 1:1 n’est pas une prédiction ; c’est une déclaration. AMD utilise son portefeuille de processeurs EPYC pour reconquérir le discours sur les centres de données.
Jugement deux : La Chine est un riche gisement de demande de calcul
Déplacer la conférence des développeurs en Chine n’est pas du marketing — c’est un positionnement stratégique.
La vitesse de déploiement des applications IA en Chine, la densité d’adoption des agents en entreprise et le volume d’achat de puissance de calcul se classent tous dans la première ligne mondiale. Le sous-texte de Su sur scène était clair : si vous ne pouvez pas gagner les développeurs en Chine, vous ne pouvez pas gagner la guerre de l’infrastructure IA au niveau mondial.
Les défis actuels d’AMD :
- Le fossé de l’écosystème CUDA reste profond
- La maturité de ROCm est encore en retard sur nvcc + cuDNN
- Les coûts de migration des développeurs sont réels
Mais les atouts d’AMD sont également clairs :
- La part de marché d’EPYC dans les CPU pour centres de données continue de grimper
- Les GPU de la série MI offrent des avantages coût-performance pour l’inférence
- La voie open-source attire les grandes entreprises cherchant à éviter le verrouillage par un fournisseur unique
Ce que les agents changent
Les agents ne sont pas de “meilleurs chatbots”. Leurs caractéristiques techniques entraînent des changements d’architecture sous-jacents :
| Caractéristique | Impact sur le calcul |
|---|---|
| Tâches multi-étapes | Gestion d’état persistante requise ; charge de planification CPU accrue |
| Appels d’outils | I/O fréquentes ; bande passante mémoire et latence sensibles |
| Contexte long | Gonflement du cache KV ; la capacité mémoire devient une contrainte dure |
| Entrée multimodale | Pipelines de prétraitement complexes ; demande de calcul hétérogène en hausse |
| Décisions en temps réel | Inférence à faible latence ; ne peut pas passer par le pipeline GPU complet à chaque fois |
Ces caractéristiques pointent collectivement vers une conclusion : l’infrastructure IA passe de la “force brute GPU mono-machine” à “l’architecture fine collaborative CPU+GPU”.
AMD détient à la fois EPYC et Instinct — c’est ce qui lui donne la confiance nécessaire pour déclarer 1:1.
Paysage concurrentiel : Impasse à trois
| Fournisseur | Avantage CPU | Avantage GPU | Écosystème |
|---|---|---|---|
| NVIDIA | Faible (Grace pas encore largement déployé) | Dominant (écosystème CUDA) | Fermé mais mature |
| AMD | Fort (EPYC) | Modéré (ROCm rattrape) | Voie open-source |
| Intel | Modéré (part de marché Xeon en déclin) | Faible (Gaudi traction limitée) | Promotion oneAPI en cours |
La stratégie d’AMD est explicite : tirer parti de la base installée CPU pour entraîner la pénétration incrémentale GPU. Les agents sont le point d’entrée parfait — car dans ce scénario, le CPU n’est plus un acteur de soutien.
Impact pratique pour les développeurs
Si vous êtes un développeur d’applications IA, qu’est-ce que cela signifie ?
- La programmation hétérogène devient la norme. Les compétences CUDA pures perdent de la valeur ; les ingénieurs capables de répartir les charges entre CPU et GPU sont plus rares
- L’optimisation de l’inférence vaut plus que l’optimisation de l’entraînement. À l’ère des agents, 90% de la consommation de calcul concerne l’inférence et la planification, pas l’entraînement
- Le risque de verrouillage matériel doit être couvert. ROCm, oneAPI et CUDA coexisteront pendant des années. Ne verrouillez pas votre code sur une seule plateforme
Conclusion
Le fait qu’AMD déplace son AI Developer Day en Chine est à la fois un signal et un pari.
Le signal : à l’ère des agents, l’architecture de calcul est en train d’être refaçonnée, et les CPU ne sont plus des accessoires des GPU.
Le pari : ROCm peut-il, à l’ombre de CUDA, utiliser le vent arrière des agents pour percer sur le plan de l’écosystème ?
Su n’a pas répondu directement à cette question. Mais le fait de déplacer la conférence en Chine est en soi la réponse — la demande ici est suffisamment importante pour redéfinir les règles.