Skip to main content

NVIDIA B200 (Blackwell)

产品概述

NVIDIA B200 是 Blackwell 架构的旗舰 GPU,单卡 FP4 算力 18 PFLOPS(稀疏),是当前(2025)性能最强的 AI 训练和推理 GPU。B200 与 B100 同样使用双芯片设计,但 TDP 提升到 1,000 W,需要重新设计的服务器和液冷方案。NVIDIA 还推出了 GB200 Grace Blackwell Superchip(2× B200 + Grace CPU)和 NVL72 整机柜(72 颗 B200 + 36 颗 Grace)。

核心规格

项目参数
架构Blackwell GB100(双 die)
制程TSMC 4NP
晶体管数2,080 亿
显存192 GB HBM3e
显存带宽8 TB/s
FP4 Tensor Core18 PFLOPS(稀疏)
FP8 Tensor Core9 PFLOPS(稀疏)
FP16 Tensor Core4.5 PFLOPS(稀疏)
FP6440 TFLOPS
NVLink1.8 TB/s(第五代)
TDP1,000 W(最高 1,200 W)
PCIeGen 5

厂商信息

项目内容
制造商NVIDIA Corporation
官网https://www.nvidia.com
产品页https://www.nvidia.com/en-us/data-center/blackwell/
发布2024 年 GTC,2025 年大规模量产
云端价格约 $5.87/hr(180GB 版本)

B200 关键系统

系统描述
HGX B2008× B200 服务器底板
GB200Grace CPU + 2× B200 Superchip
NVL7272× B200 + 36× Grace,整机柜 1.4 ExaFLOPS FP4

软件与驱动

关键特性

  • 第二代 Transformer Engine:FP4 / FP6 自动精度切换
  • Mixture of Experts (MoE) 优化:硬件加速 MoE 模型路由
  • Confidential Computing:硬件级加密计算
  • RAS Engine:服务器级可靠性

适用场景

  • 万亿参数 LLM 训练
  • 大规模 AI 推理(万亿参数单卡推理)
  • MoE 模型(Mixtral、Llama 4 等)
  • 多模态大模型
  • 科学计算(HPC)

相关产品对比