:::warning 部分信息
本页部分规格基于 Qualcomm 官方新闻稿和媒体报道,FP16/BF16/FP8 算力、TDP、内存容量等关键参数尚未公开,待 Qualcomm 发布完整技术白皮书后更新。
:::
产品概述
Qualcomm AI250 是 Qualcomm Technologies 于 2025 年 10 月发布的面向 数据中心 AI 推理 的芯片解决方案,是 AI200 的升级版。近存计算(Near-Memory Computing)架构,通过重构内存访问路径,实现 内存带宽提升超 10 倍,同时显著降低功耗。为 AI 推理工作负载带来能效与性能的跨越式提升,适合对实时性要求严苛的应用场景。预计 2027 年规模化应用。
战略地位:Qualcomm AI250 采用 创新的近存计算架构,是 Qualcomm 在 数据中心 AI 芯片市场 的差异化竞争产品。相比传统架构(CPU/GPU/ASIC),近存计算架构 大幅降低内存访问延迟和功耗,是 下一代 AI 推理芯片 的重要方向。
核心规格(部分)
| 项目 | 参数 |
|---|
| 架构 | 近存计算(Near-Memory Computing) |
| 制程 | 未公开(预估 3nm) |
| FP16/BF16 | 未公开 |
| FP8 | 未公开 |
| INT8 | 未公开 |
| 内存 | 未公开(预估 1-2 TB) |
| 内存带宽 | 提升超 10 倍(vs 传统架构) |
| TDP | 未公开(但显著降低) |
| 发布时间 | 2025 年 10 月 |
| 商用时间 | 2027 年 |
| 定位 | 数据中心 AI 推理(高端) |
近存计算架构
| 维度 | 说明 |
|---|
| 架构特点 | 计算单元靠近内存,减少数据搬移 |
| 带宽提升 | 超 10 倍(vs 传统架构) |
| 功耗降低 | 显著(内存访问功耗占比高) |
| 延迟降低 | 显著(减少内存访问延迟) |
| 适用场景 | 大语言模型推理、实时 AI 应用 |
与 AI200 对比
| 指标 | Qualcomm AI250 | Qualcomm AI200 | 提升 |
|---|
| 架构 | 近存计算 | 传统架构 | 创新 |
| 内存带宽 | 提升超 10 倍 | 未公开 | 大幅 |
| 功耗 | 显著降低 | 未公开 | 优化 |
| 商用时间 | 2027 年 | 2026 年 | 晚 1 年 |
| 定位 | 高端推理 | 中端推理 | AI250 更高端 |
厂商信息
适用场景
- ✅ 大语言模型(LLM)推理(近存计算优化)
- ✅ 实时 AI 应用(低延迟)
- ✅ 多模态模型(LMM)推理
- ✅ 能效敏感(低功耗)
- ❌ 模型训练(定位推理)
- ❌ 2026 年部署(2027 年才规模化应用)
相关产品
外部链接