Skip to main content

NVIDIA H20 (2024)

产品概述

NVIDIA H20 是 NVIDIA 针对中国市场推出的出口合规版 AI 加速卡,基于 Hopper 架构(与 H100/H200 同架构),于 2024 年初正式发布。

受美国出口管制限制(2023 年 10 月新规),H20 的算力被刻意削减以符合合规要求:

  • FP16: 148 TFLOPS(H100 的 ~15%)
  • FP8: 296 TFLOPS(H100 的 ~15%)
  • 显存: 96GB HBM3(带宽 4.0 TB/s)

H20 的定位是:在合规前提下,尽可能保留 NVIDIA 生态优势,与国产 AI 芯片(海光 DCU、昆仑芯、沐曦等)竞争。

核心规格

项目参数
架构Hopper(出口合规削减版)
制程TSMC 4N (4nm)
FP8296 TFLOPS
FP16148 TFLOPS
TF3274 TFLOPS
FP3224 TFLOPS
INT8296 TOPS
显存容量96GB HBM3
显存带宽4.0 TB/s
互联NVLink 900 GB/s(降级)
TDP400W
发布2024 年初
停产2025 年 7 月(NVIDIA 通知渠道商)

出口合规背景

美国出口管制时间线

时间事件
2022-10美国 BIS 发布出口管制,限制 A100/H100 对华出口
2023-10新规进一步收紧,新增"性能密度"限制
2023-11NVIDIA 推出 H20 / L20 / L2(合规版)
2024-02H20 开始向中国客户出货
2025-07NVIDIA 通知渠道商 H20 将停产(出口管制再收紧)

合规限制参数

参数限制阈值H20 实际值
FP16 算力< 300 TFLOPS148 TFLOPS
性能密度< 某阈值合规
显存带宽无明确限制4.0 TB/s(未削减)

策略:NVIDIA 选择保留显存带宽(对大模型推理重要),大幅削减算力,以在合规前提下保持竞争力。

与国产芯片对比

H20 vs 海光 DCU K100

指标NVIDIA H20海光 DCU K100差异
FP16148 TFLOPS192 TFLOPSK100 +30%
显存96GB HBM364GB HBM3H20 +50%
带宽4.0 TB/s3.2 TB/sH20 +25%
生态CUDA(完整)ROCm(兼容)H20 优势
供货2025 年停产稳定供货K100 优势
价格~$25k(估算)~$15k(估算)K100 便宜

H20 vs 昆仑芯 P800

指标NVIDIA H20昆仑芯 P800差异
FP16148 TFLOPS345 TFLOPSP800 2.3×
显存96GB HBM332GB HBM3H20 +200%
带宽4.0 TB/s未公开H20 优势
生态CUDA百度 Paddle各有优势

结论:H20 的显存容量和带宽仍有优势,但算力已被国产芯片超越。随着 2025 年 H20 停产,国产替代加速。

适用场景

  • NVIDIA 生态迁移过渡期(CUDA 代码无需修改)
  • 大模型推理(96GB 显存 + 4.0 TB/s 带宽优势)
  • 短期项目(2025 年 7 月前仍可采购)
  • 长期训练集群(2025 年停产,供应链风险)
  • 性价比优先(国产芯片算力更高、价格更低)
  • 自主可控要求(美国政府可随时收紧出口管制)

停产影响(2025 年 7 月)

2025 年 7 月,NVIDIA 通知渠道商 H20 将停产,原因:

  1. 美国出口管制可能进一步收紧
  2. H20 利润空间被压缩(刻意削减算力)
  3. NVIDIA 优先产能给 H200/B200

对中国市场的影响

  • 已采购 H20 的客户:短期无影响,长期维修/扩容困难
  • 未采购的客户:加速转向国产芯片(海光、昆仑芯、沐曦等)
  • 国产替代进程:提前 1-2 年

厂商信息

项目内容
公司NVIDIA Corporation
架构Hopper(出口合规削减版)
发布2024 年初
停产2025 年 7 月(通知渠道商)
中国市场定位出口合规版,替代 H100/A100
竞争对手海光 DCU、昆仑芯、沐曦、壁仞等

相关卡