AMD AI开发者日首次落地中国:苏姿丰押注智能体,CPU与GPU算力配比迎来1:1时代
5 月 19 日,AMD 在中国举办首届 AI 开发者日。这是该活动历史上首次离开美国本土。
会场里,没有座位的观众站了一排又一排。AMD 董事会主席兼 CEO 苏姿丰(Lisa Su)的主题演讲,核心就两件事:智能体(Agent)和 CPU 的回归。
两个关键判断
判断一:CPU 正在变得越来越关键
苏姿丰给出的数字很直接:
传统数据中心里,CPU 与 GPU 的比例是 1:4。到 2026 年,这个比例会变成 1:1。
这意味着什么?
过去十年,AI 算力叙事几乎被 GPU 垄断。训练大模型需要 CUDA,推理加速靠 Tensor Core。CPU 被边缘化为”控制平面”——发号施令,但不参与主力运算。
苏姿丰的判断是:智能体时代,计算负载在变化。
- 智能体不是单次推理,而是多步骤、长周期的任务流
- 每一步之间需要调度、决策、状态管理——这些是 CPU 的强项
- 当 GPU 负责并行计算时,CPU 负责串行协调,两者缺一不可
1:1 的比例不是预测,是宣言。AMD 正在用 EPYC 处理器产品线,重新争夺数据中心的话语权。
判断二:中国市场是算力需求的富矿
把开发者大会搬到中国,不是市场公关,是战略判断。
中国的 AI 应用落地速度、企业级智能体部署密度、以及算力采购规模,在全球都是第一梯队。苏姿丰在现场的潜台词很清楚:如果不能在中国赢得开发者,就无法在全球赢得 AI 基础设施的战争。
AMD 目前的挑战在于:
- CUDA 生态的护城河依然深厚
- ROCm 的成熟度与 nvcc + cuDNN 相比仍有差距
- 开发者迁移成本是真实的
但 AMD 的筹码也很清晰:
- EPYC 在数据中心 CPU 市场的份额持续上升
- MI 系列 GPU 在推理场景的性价比优势
- 开源路线对希望摆脱单一供应商锁定的大型企业有吸引力
智能体改变了什么
智能体(Agent)不只是”更好的聊天机器人”。它的技术特征决定了底层架构的变迁:
| 特征 | 对算力的影响 |
|---|---|
| 多步骤任务 | 需要持久化状态管理,CPU 调度负担加重 |
| 工具调用 | 频繁 I/O,内存带宽和延迟敏感 |
| 长上下文 | KV Cache 膨胀,显存容量成为硬约束 |
| 多模态输入 | 预处理管线复杂,异构计算需求上升 |
| 实时决策 | 低延迟推理,不能每次都走完整 GPU 流水线 |
这些特征共同指向一个结论:AI 基础设施正在从”GPU 单机暴力美学”,转向”CPU+GPU 协同的精细架构”。
AMD 同时手握 EPYC 和 Instinct,是它敢于喊出 1:1 的底气。
竞争格局:三足鼎立
| 厂商 | CPU 优势 | GPU 优势 | 生态 |
|---|---|---|---|
| NVIDIA | 弱(Grace 尚未大规模部署) | 极强(CUDA 生态) | 封闭但成熟 |
| AMD | 强(EPYC) | 中等(ROCm 追赶中) | 开源路线 |
| Intel | 中等(至强市场份额下滑) | 弱(Gaudi 声量有限) | oneAPI 推广中 |
AMD 的策略很明确:用 CPU 的存量优势带动 GPU 的增量渗透。智能体是完美的切入点——因为这个场景下,CPU 不再是配角。
对开发者的实际影响
如果你是 AI 应用开发者,这件事意味着什么?
- 异构编程成为标配。纯 CUDA 技能的价值在衰减,懂得在 CPU 和 GPU 之间分配负载的工程师更稀缺
- 推理优化比训练优化更值钱。智能体时代,90% 的算力消耗在推理和调度,不是训练
- 硬件绑定风险需要对冲。ROCm、oneAPI、CUDA 三者并存的局面会持续数年,不要把代码锁死在单一平台上
结语
AMD 把 AI 开发者日搬到中国,是一个信号,也是一个赌注。
信号是:智能体时代,算力架构在重塑,CPU 不再是 GPU 的附庸。
赌注是:ROCm 能否在 CUDA 的 shadow 下,借智能体的东风,完成生态突围。
苏姿丰没有直接回答这个问题。但她把大会搬到中国,本身就是答案——这里的需求足够大,大到可以重新定义规则。