Skip to main content

Google Cloud TPU v5p

产品概述

Google TPU v5p(v5 Premium)是 Google 第五代 Premium TPU,2023 年发布,专注于大规模 LLM 训练(如 Gemini)。459 TFLOPS BF16 算力95GB HBM,单 Pod 规模 8,960 芯片。通过 3D Torus + OCS(光路交换机)互联,仅通过 Google Cloud 提供。

核心规格

项目参数
架构Google TPU v5p(脉动阵列)
制程TSMC 5nm
BF16 算力(每芯片)459 TFLOPS
INT8 算力(每芯片)459 TOPS
HBM 容量95 GB
HBM 带宽2,575 GB/s
ICI 互联带宽1,200 GB/s(双向)
DCN 带宽50 Gbps
Pod 规模8,960 芯片(4×4×4×140 3D Torus)
散热液冷
提供方式仅 Google Cloud

TPU v5p vs v5e vs v4

指标v4v5ev5p
BF16 算力275 TFLOPS197 TFLOPS459 TFLOPS
HBM 容量32 GB16 GB95 GB
带宽1,200 GB/s400 GB/s2,575 GB/s
Pod 规模4,0962568,960
定位训练推理训练

厂商信息

项目内容
制造商Google LLC
官网https://cloud.google.com/tpu
产品页https://cloud.google.com/tpu/docs/v5p
仅限Google Cloud Platform

软件

关键特性

  • 脉动阵列(Systolic Array):矩阵乘法高效
  • 3D Torus 互联 + OCS 光交换机
  • Pathways 编排:可扩展到多个 Pod
  • JAX 一等公民

适用场景

  • LLM 训练(Gemini、PaLM)
  • 推荐系统
  • 多模态模型

相关产品对比