AMD Instinct MI300A (APU)
产品概述
AMD Instinct MI300A 是 APU 架构的 AI 训练卡,GPU + CPU 集成封装,与 Apple M-Series 类似的统一内存架构。在 MI300X(纯 GPU)基础上加入 24 核 Zen 4 CPU,共享 128GB HBM3 内存池。
HPC 性能怪兽:1.5 PFLOPS FP8 / 2.5 PFLOPS FP16。全球首款 Exascale 超级计算机 El Capitan(劳伦斯利弗莫尔国家实验室)即使用 44,000+ 颗 MI300A。
核心规格
| 项目 | 参数 |
|---|
| 架构 | CDNA 3 + Zen 4(APU) |
| 制程 | TSMC 5nm + 6nm Chiplet |
| GPU 流处理器 | 14,592(228 CUs) |
| CPU 核心 | 24 核 Zen 4(×4 CCD) |
| 统一内存 | 128 GB HBM3(CPU+GPU 共享) |
| 内存带宽 | 5.3 TB/s |
| FP16 算力 | 1.5 PFLOPS(密集) / 2.5 PFLOPS(稀疏) |
| FP8 算力 | 1.5 PFLOPS(密集) / 2.5 PFLOPS(稀疏) |
| INT8 | 1.5 POPS |
| TDP | 600 W |
| 接口 | PCIe Gen5 ×16 + Infinity Fabric |
| 互联 | Infinity Fabric 4(896 GB/s) |
| 首发 | 2024-01(El Capitan 部署) |
| 价格 | $15,000-$20,000(OEM) |
APU 架构详解
统一内存优势
- CPU + GPU 共享 128GB HBM3(无需数据拷贝)。
- 5.3 TB/s 带宽(HBM3e 标称 5.3 TB/s)。
- 适合 HPC 数值模拟(CPU 部分处理逻辑、GPU 部分处理并行计算)。
Chiplet 设计
- 3 个 5nm SoC Chiplet(GPU + I/O)
- 6 个 6nm IOD Chiplet(内存控制器 + Infinity Fabric)
- 24 核 Zen 4 CPU 分布于 SoC 上
- 主动 Interposer 互连
与 MI300X 对比
| 指标 | MI300A | MI300X |
|---|
| CPU | 24 核 Zen 4 | 无 |
| 内存 | 128GB HBM3 | 192GB HBM3 |
| 带宽 | 5.3 TB/s | 5.3 TB/s |
| FP16 | 1.5 PFLOPS | 1.5 PFLOPS |
| TDP | 600W | 750W |
| 适用 | HPC + AI | 纯 AI |
El Capitan 超级计算机
- 2024 全球超算 TOP500 #1(2024-11)
- 1.742 ExaFLOPS FP64(双精度)
- 44,544 颗 MI300A
- 耗电 ~30 MW(vs 顶级 x86 超算 50+ MW)
- HPC 任务:核武器模拟、气候变化、材料科学
厂商信息
适用场景
- ✅ HPC + AI 联合(El Capitan 类超算)
- ✅ 数值模拟 + ML 混合(气候、材料、生命科学)
- ✅ 大模型训练(192GB 版本 MI300X 替代)
- ✅ 需要 CPU 加速的图神经网络
- ❌ 纯 LLM 推理(应使用 MI300X 或 H100)
- ❌ 边缘部署(600W TDP)
相关卡