Alibaba PPU(含光800 下一代)
产品概述
Alibaba PPU 是阿里巴巴旗下 平头哥(T-Head) 半导体公司研发的新一代 AI 推理芯片,是含光 800 的下一代产品。2023 年台积电流片,原计划 2024 年量产,受美国制裁影响转由国内企业生产,截至 2025 年 9 月尚未公布正式名称("PPU" 为项目阶段临时标识)。
PPU 在显存容量(96GB HBM2e) 和 PCIe 5.0 接口 上优于 NVIDIA H20,单卡 BOM 成本比 H20 低 40%,可推动阿里云公有云推理实例价格下降 50%。
⚠️ 名称说明:PPU 为项目阶段临时标识,正式商用型号尚未公布。行业人士推测其为含光 800 的下一代产品。
核心规格(已公开)
| 项目 | 参数 |
|---|---|
| 架构 | 平头哥自研 NPU 架构 |
| 制程 | 7nm(推测,受制裁后转国内代工) |
| HBM | 96 GB HBM2e |
| 内存带宽 | 700 GB/s |
| TDP | 400 W |
| 接口 | PCIe 5.0 ×16 |
| 片间互联 | 700 GB/s(具体协议未公开) |
| 量产时间 | 原计划 2024,受制裁影响推迟 |
| 商用时间 | 2025 年测试中,尚未公布 |
📌 数据说明:FP32/FP16/INT8 算力、高速互联技术等核心指标尚未公开,实际性能有待后续实测验证。
PPU vs NVIDIA H20 对比
| 指标 | Alibaba PPU | NVIDIA H20 | 对比 |
|---|---|---|---|
| HBM 容量 | 96GB HBM2e | 96GB HBM3 | 容量持平 |
| 内存带宽 | 700 GB/s | >1 TB/s | H20 带宽领先 |
| TDP | 400W | 400W | 持平 |
| 接口 | PCIe 5.0 ×16 | PCIe 5.0 | PPU 接口更先进 |
| 单卡成本 | -40% vs H20 | 基准 | PPU 成本优势显著 |
| 生态 | 自研 HALO 栈 | CUDA | H20 生态成熟 |
| 综合性能 | 接近 H20 | 基准 | PPU 是重要突破 |
落地情况
- 中国联通三江源绿电智算中心:阿里云签约 1,024 台设备、16,384 张平头哥算力卡,贡献 1,945 P 算力(项目中采购规模最大品牌)
- 阿里内部:淘宝搜索推荐、阿里云 PAI 平台、菜鸟物流调度(含光 800 已部署,PPU 将逐步替代)
战略意义
- 国产替代:受美国制裁影响,转由国内代工,是国产 AI 芯片供应链自主化的重要突破
- 成本优势:单卡 BOM 成本比 H20 低 40%,推动阿里云推理实例价格下降 50%
- 性能突破:综合性能接近 H20,是含光 800(12nm, 820 TOPS)的重大升级
厂商信息
| 项目 | 内容 |
|---|---|
| 厂商 | 阿里巴巴 平头哥半导体(T-Head) |
| 产品页 | https://www.t-head.cn/ |
| 软件栈 | HALO(Hanguang Accelerated Linear Operator) |
| 生态定位 | 阿里云内部部署 + 未来对外销售 |
相关产品
- Alibaba 含光 800 - 前代芯片(2019 发布)
- NVIDIA H20 - 主要竞品
- 华为昇腾 910C - 同期国产 AI 芯片
- 完整对比表