跳到主要内容

NVIDIA H100 (Hopper)

产品概述

NVIDIA H100 是基于 Hopper 架构 GH100 芯片的旗舰级数据中心 GPU,2022 年发布,是当前(2025 年)大语言模型训练和推理的事实标准。它引入了 Transformer Engine(FP8 精度动态加速)和 DPX 指令集(动态规划算法加速)。

核心规格

项目参数
架构Hopper GH100
制程TSMC 4N(定制 5nm)
晶体管数800 亿
显存80 GB HBM3
显存带宽3.35 TB/s(3,352 GB/s)
CUDA Core16,896
Tensor Core528 个(第四代)
FP3260 TFLOPS
FP6434 TFLOPS(双精度 HPC 重要)
TF32 Tensor Core989 TFLOPS(稀疏)
FP16/BF16 Tensor Core1,979 TFLOPS(稀疏)
FP8 Tensor Core3,958 TFLOPS(稀疏)
INT8 Tensor Core3,958 TOPS(稀疏)
TDP700 W(SXM5)
互联NVLink 4.0(900 GB/s),PCIe 5.0
MIG最多 7 个实例
形式SXM5 / PCIe 5.0

厂商信息

项目内容
制造商NVIDIA Corporation
官网https://www.nvidia.com
产品页https://www.nvidia.com/en-us/data-center/h100/
发布2022 年 3 月 GTC 大会
停产大部分渠道已被 H200 / Blackwell 替代

软件与驱动

资源链接
数据中心驱动https://www.nvidia.com/Download/index.aspx
CUDA Toolkithttps://developer.nvidia.com/cuda-toolkit
TensorRThttps://developer.nvidia.com/tensorrt
NVIDIA AI Enterprisehttps://www.nvidia.com/en-us/data-center/products/ai-enterprise/
NCCL(多卡通信)https://developer.nvidia.com/nccl

关键特性

  • Transformer Engine:自动在 FP8 与 FP16 之间切换,加速 Transformer 训练
  • 第四代 Tensor Core:支持 FP8(E4M3、E5M2)
  • DPX 指令:硬件加速动态规划算法
  • MIG:单卡虚拟化为最多 7 个独立 GPU
  • NVLink 4.0 + NVSwitch 3.0:服务器内 900 GB/s 互联

适用场景

  • LLM 训练与微调
  • 推荐系统与多模态 AI
  • HPC 科学计算
  • 大规模分布式训练集群

相关产品对比