产品概述
NVIDIA B200 是 Blackwell 架构的旗舰 GPU,单卡 FP4 算力 18 PFLOPS(稀疏),是当前(2025)性能最强的 AI 训练和推理 GPU。B200 与 B100 同样使用双芯片设计,但 TDP 提升到 1,000 W,需要重新设计的服务器和液冷方案。NVIDIA 还推出了 GB200 Grace Blackwell Superchip(2× B200 + Grace CPU)和 NVL72 整机柜(72 颗 B200 + 36 颗 Grace)。
核心规格
| 项目 | 参数 |
|---|
| 架构 | Blackwell GB100(双 die) |
| 制程 | TSMC 4NP |
| 晶体管数 | 2,080 亿 |
| 显存 | 192 GB HBM3e |
| 显存带宽 | 8 TB/s |
| FP4 Tensor Core | 18 PFLOPS(稀疏) |
| FP8 Tensor Core | 9 PFLOPS(稀疏) |
| FP16 Tensor Core | 4.5 PFLOPS(稀疏) |
| FP64 | 40 TFLOPS |
| NVLink | 1.8 TB/s(第五代) |
| TDP | 1,000 W(最高 1,200 W) |
| PCIe | Gen 5 |
厂商信息
B200 关键系统
| 系统 | 描述 |
|---|
| HGX B200 | 8× B200 服务器底板 |
| GB200 | Grace CPU + 2× B200 Superchip |
| NVL72 | 72× B200 + 36× Grace,整机柜 1.4 ExaFLOPS FP4 |
软件与驱动
关键特性
- 第二代 Transformer Engine:FP4 / FP6 自动精度切换
- Mixture of Experts (MoE) 优化:硬件加速 MoE 模型路由
- Confidential Computing:硬件级加密计算
- RAS Engine:服务器级可靠性
适用场景
- 万亿参数 LLM 训练
- 大规模 AI 推理(万亿参数单卡推理)
- MoE 模型(Mixtral、Llama 4 等)
- 多模态大模型
- 科学计算(HPC)
相关产品对比