NVIDIA L2 (Ada 入门级推理)
产品概述
NVIDIA L2 是 Ada Lovelace 架构的入门级推理卡,定位低于 L4。24GB GDDR6 显存,TDP 仅 50-75W,单 PCIe 槽位可部署。
主要面向边缘服务器、电信运营商、零售业等需要低功耗 AI 推理的场景。
核心规格
| 项目 | 参数 |
|---|---|
| 架构 | Ada Lovelace (AD102 简化) |
| 制程 | TSMC 4N |
| CUDA 核心 | 4,608 |
| Tensor 核心 | 144(第四代) |
| RT 核心 | 36(第三代) |
| 显存 | 24 GB GDDR6 |
| 显存带宽 | 384 GB/s(16 Gbps × 192-bit) |
| FP8 Tensor | 96 TFLOPS(稀疏)/ 48 TFLOPS 密集 |
| INT8 Tensor | 96 TOPS(密集)/ 192 TOPS 稀疏 |
| TDP | 50-75 W |
| 形态 | PCIe Gen4 ×16 单槽 / 半高半长 |
| 首发 | 2024-Q4 |
| 价格 | $1,500-$2,000 |
L2 vs L4 vs T4 对比
| 指标 | L2 | L4 | T4 |
|---|---|---|---|
| 架构 | Ada | Ada | Turing |
| CUDA 核心 | 4,608 | 7,680 | 2,560 |
| 显存 | 24GB GDDR6 | 24GB GDDR6 | 16GB GDDR6 |
| 带宽 | 384 GB/s | 300 GB/s | 320 GB/s |
| FP8 Tensor(稀疏) | 96 TFLOPS | 485 TFLOPS | N/A |
| TDP | 50-75W | 72W | 70W |
| 形态 | 单槽 | 单槽 | 单槽 |
L2 FP8 性能约为 L4 的 20%(96/485 稀疏),但 TDP 类似 → L4 性能/瓦特更优。
适用场景
- ✅ 边缘服务器 AI 推理(5G MEC)
- ✅ 电信运营商 vRAN + AI 联合
- ✅ 零售业边缘 AI(视频分析)
- ✅ 嵌入式数据中心
- ❌ 大模型推理(应使用 L40S/H100)
- ❌ 训练(缺乏 FP8 算力优势)
厂商信息
| 项目 | 内容 |
|---|---|
| 厂商 | NVIDIA |
| 目标市场 | 边缘服务器、电信、零售 |
| 价格 | $1,500-$2,000 |
相关卡
- NVIDIA L4 - 同代次旗舰
- NVIDIA L40S - 数据中心版
- NVIDIA T4 - 上一代入门
- Qualcomm Cloud AI 100 - 同类低功耗 ASIC