NVIDIA H200 (Hopper Refresh)
产品概述
NVIDIA H200 于 2024 年发布,是 H100 的显存升级版本。最大变化是从 80GB HBM3 升级到 141GB HBM3e,带宽从 3.35 TB/s 提升到 4.8 TB/s(+43%)。这让 H200 在 70B+ 参数大模型推理场景下性能显著提升,可单卡加载更长的上下文。
核心规格
| 项目 | 参数 |
|---|
| 架构 | Hopper GH100(refresh) |
| 制程 | TSMC 4N |
| 晶体管数 | 800 亿 |
| 显存 | 141 GB HBM3e |
| 显存带宽 | 4.8 TB/s(4,800 GB/s) |
| CUDA Core | 16,896 |
| Tensor Core | 528 个(第四代) |
| FP8 Tensor Core | 3,958 TFLOPS(稀疏) |
| TDP | 700 W(SXM5) |
| 互联 | NVLink 4.0(900 GB/s),PCIe 5.0 |
| MIG | 最多 7 个实例 |
| 形式 | SXM5 / PCIe 5.0 |
H100 vs H200 对比
| 指标 | H100 | H200 | 提升 |
|---|
| 显存容量 | 80 GB | 141 GB | +76% |
| 显存类型 | HBM3 | HBM3e | 更快 |
| 显存带宽 | 3.35 TB/s | 4.8 TB/s | +43% |
| FP8 算力 | 3,958 TFLOPS | 3,958 TFLOPS | 相同 |
| 售价(参考) | 约 $25,000–30,000 | 约 $30,000–35,000 | +20% |
厂商信息
软件与驱动
适用场景
- 大模型推理(70B+ 单卡加载)
- 长上下文(100K+ tokens)推理
- 大模型微调
- HPC 内存受限型工作负载
相关产品对比