跳到主要内容

AI 算力卡未来路线图(2025-2027)

基于厂商公告、供应链消息和行业分析。实际发布时间以厂商官方为准

2025 Q2-Q3(已发布 / 近期)

时间产品厂商关键信息
2025-04NVIDIA B200NVIDIABlackwell,192GB HBM3e,9 PFLOPS
2025-04NVIDIA GB200NVIDIA2× B200 + Grace CPU,LLM 推理怪兽
2025-05AMD MI355XAMDCDNA 4,288GB HBM3e,10.1 PFLOPS
2025-06Google TPU v6e (Trillium)Google918 TFLOPS BF16,32GB HBM,已 GA
2025-08华为昇腾 910C华为双 Die 910B,780 TFLOPS,国内量产

2025 Q4 - 2026 Q1(即将发布)

时间产品厂商预期规格
2025-Q4NVIDIA B300 UltraNVIDIA288GB HBM3e,14 PFLOPS,1,400W
2025-Q4AMD MI400 (Helios)AMD432GB HBM4,40 PFLOPS FP4,19.6 TB/s
2025-Q4Intel Gaudi 4Intel6nm,128GB SRAM,2.4 Tb/s
2026-Q1NVIDIA Rubin R200NVIDIA288GB HBM4,50 PFLOPS FP4,2026 H2 旗舰
2026-Q1Google TPU 8t (训练) + 8i (推理)GoogleTPU v8 正式拆分训练/推理
2026-Q1AWS Trainium 3AWS3nm,~2,000 TFLOPS,128GB HBM

2026 H2(已官宣 / 高度预期)

时间产品厂商关键信息
2026-H1NVIDIA Rubin R200NVIDIAHBM4,50 PFLOPS FP4,Vera CPU + NVLink 6
2026-H1AMD MI400 + Helios 机柜AMD432GB HBM4,260 TB/s UALink,机架级方案
2026-H1Google TPU Ironwood (v7)Google192GB HBM,~2,000 TFLOPS BF16
2026-H1Cerebras WSE-4Cerebras1.4 万亿晶体管,125 PFLOPS FP8
2026-H2华为昇腾 920华为900+ TFLOPS BF16,4 Tbps 片间互联

2027(前瞻)

时间产品厂商预期方向
2027NVIDIA Rubin UltraNVIDIA可能是 Wafer-Scale 或 3D 堆叠方案
2027AMD MI500AMDCDNA 5,可能引入 HBM4e 或 3D 堆叠
2027Google TPU v9Google可能引入光学互联或 3D 堆叠 HBM
2027Intel Jaguar ShoresIntelXe-HPC + Gaudi 融合架构,对标 B200

关键技术趋势

HBM4 / HBM4e(2026-2027)

  • HBM4:1,024-bit 接口,理论带宽 2.4 TB/s/stack,NVIDIA Rubin / AMD MI400 首发
  • HBM4e:2027 年底,可能用于 Rubin Ultra

Wafer-Scale / 机架级(2026+)

  • NVIDIA Blackwell-Next / Rubin Ultra:可能走向 Wafer-Scale(参考 Cerebras)
  • AMD Helios:机柜级方案,260 TB/s UALink 互联
  • Tesla Dojo v2:自动标注 + 训练一体化,2026 年目标 100 ExaFLOPS

低精度计算(FP4 / INT4)

  • NVIDIA Rubin R200:50 PFLOPS FP4(稀疏),比 B200 快 5×+
  • AMD MI400:40 PFLOPS FP4(密集),Helios 机柜总算力 ~2 ExaFLOPS
  • 趋势:FP8 → FP4 → INT4,精度换算力

国产替代加速(中国)

  • 华为昇腾 910C(2024 H2):双 Die 910B,780 TFLOPS
  • 华为昇腾 920(2025 H2):900+ TFLOPS,4 Tbps 片间互联
  • 寒武纪思元 690:~1,000 TFLOPS,对标 A100
  • 摩尔线程 MTT S5000:~200 TFLOPS,国产 GPU 生态建设

发布时间线(可视化)

timeline
title AI 算力卡发布路线图(2025-2027)
section 2025 Q2
NVIDIA B200 : 已发布
AMD MI355X : 已发布
Google TPU v6e : 已 GA
section 2025 Q4
NVIDIA B300 Ultra : 预期 Q4
AMD MI400 Helios : 预期 Q4
Intel Gaudi 4 : 预期 Q4
华为昇腾 910C : 已量产
section 2026 Q1-Q2
NVIDIA Rubin R200 : 官宣 H2
Google TPU 8t/8i : 预期 Q1
AWS Trainium 3 : 预期 Q1
section 2026 H2
AMD MI400 (量产) : 预期 H2
Google TPU Ironwood : 预期 H1
Cerebras WSE-4 : 已官宣
华为昇腾 920 : 预期 H2
section 2027
NVIDIA Rubin Ultra : 前瞻
AMD MI500 : 前瞻
Google TPU v9 : 前瞻

数据来源与更新

  • 厂商官方公告(NVIDIA GTC、AMD Advancing AI、Google I/O、华为全联接大会)
  • 供应链泄露(DigiTimes、Tom's Hardware、ServeTheHome)
  • 学术论文与专利分析
  • 行业分析师报告(TrendForce、Jon Peddie Research)

发现信息有误或缺失?提交 Issue


← 返回首页 | 完整对比表 →