产品概述
NVIDIA L4 是面向云端 AI 推理的低功耗 GPU,2023 年发布,基于 Ada Lovelace 架构。仅 72W TDP,可被动散热,FP8 算力 485 TFLOPS,是 T4 的 3 倍推理性能。L4 支持 AV1 硬件编码解码,适合云游戏、实时视频 AI、生成式 AI 推理等场景。
核心规格
| 项目 | 参数 |
|---|
| 架构 | Ada Lovelace AD104 |
| 制程 | TSMC 4N |
| 显存 | 24 GB GDDR6 |
| 显存带宽 | 300 GB/s |
| CUDA Core | 7,680 |
| Tensor Core | 240(第四代) |
| FP32 | 30.3 TFLOPS |
| FP8 Tensor Core | 485 TFLOPS |
| INT8 Tensor Core | 485 TOPS |
| TDP | 72 W(可被动散热) |
| PCIe | Gen 4 x16 |
| 视频编解码 | 2× NVENC(AV1)+ 4× NVDEC(AV1) |
T4 vs L4 性能对比
| 指标 | T4 (Turing) | L4 (Ada) | 提升 |
|---|
| FP16 算力 | 65 TFLOPS | 121 TFLOPS | 1.9× |
| INT8 算力 | 130 TOPS | 242 TOPS | 1.9× |
| FP8 算力 | N/A | 485 TFLOPS | 新增 |
| 显存 | 16 GB | 24 GB | +50% |
| 带宽 | 320 GB/s | 300 GB/s | 略低 |
| TDP | 70 W | 72 W | 相同 |
| 视频编解码 | 1× NVENC | 2× NVENC(AV1) | +100% |
厂商信息
适用场景
- 云端 AI 推理(生成式 AI、LLM)
- 云游戏(高密度部署)
- 视频 AI(转码、内容审核、AV1 直播)
- 边缘 AI 推理
相关产品对比