Skip to main content

Google Cloud TPU v7 (Ironwood)

产品概述

Google TPU v7(代号 Ironwood)是 2025 年发布的最新一代 TPU,专为推理时代设计。BF16 算力 2,307 TFLOPS(每芯片),HBM 容量 192GB(与 NVIDIA H200 / MI300X 同级),带宽 7,380 GB/s。Ironwood 是首批以推理为先的 TPU,FP8 算力 4,614 TFLOPS(每芯片)。

核心规格

项目参数
架构TPU v7(Ironwood)
BF16 算力(每芯片)2,307 TFLOPS
FP8 算力(每芯片)4,614 TFLOPS
HBM 容量192 GB
HBM 带宽7,380 GB/s
ICI 互联带宽1,200 GB/s(双向)
DCN 带宽100 Gbps
TensorCores2/芯片
SparseCores4/芯片
Pod 规模9,216 芯片
拓扑3D Torus

历代 TPU 对比

指标v4v5pv6e (Trillium)v7 (Ironwood)
BF16 算力275 TFLOPS459 TFLOPS918 TFLOPS2,307 TFLOPS
FP8 算力N/A459 TFLOPS918 TFLOPS4,614 TFLOPS
HBM 容量32 GB95 GB32 GB192 GB
HBM 带宽1,200 GB/s2,575 GB/s1,638 GB/s7,380 GB/s
Pod 规模4,0968,9602569,216

Ironwood vs H200 / MI300X

指标TPU v7H200MI300X
显存192 GB141 GB192 GB
带宽7,380 GB/s4,800 GB/s5,300 GB/s
FP8 算力4,614 TFLOPS3,958 TFLOPS2,614 TFLOPS

关键优势:TPU v7 在显存带宽和 FP8 算力上领先。

厂商信息

项目内容
制造商Google LLC
官网https://cloud.google.com/tpu
产品页https://cloud.google.com/tpu/docs/tpu7x
发布2025 年
提供方式仅 Google Cloud

关键特性

  • 推理优先:相比前代侧重训练,Ironwood 优化推理
  • 超大内存容量:192GB 可加载 70B+ 模型单芯片
  • FP8 双倍 BF16:现代推理算力
  • 3D Torus 9,216 芯片 Pod

适用场景

  • LLM 推理(Gemini 3 / 4)
  • 大规模 MoE 模型
  • 多模态 AI 推理
  • 嵌入密集型应用

相关产品对比