Skip to main content

Apple M3 Ultra (192GB 统一内存)

产品概述

Apple M3 Ultra 是 Apple Silicon 顶级旗舰,2023-12 发布。通过 UltraFusion 互连将两片 M3 Max 芯片合并为单芯片,192GB 统一内存可加载完整 70B+ LLM

核心规格

项目参数
架构Apple Silicon (M3 Max × 2, UltraFusion)
制程TSMC 3nm
CPU 核心32(24P + 8E)
GPU 核心80
Neural Engine64-core, 72 TOPS
统一内存96GB / 192GB / 256GB LPDDR5
内存带宽800 GB/s
FP32 GPU~28 TFLOPS
FP16 GPU~56 TFLOPS
媒体引擎硬件 H.264/HEVC/ProRes/AV1
TDP90-215 W(取决于负载)
首发价Mac Studio M3 Ultra 192GB: $5,899
首发日期2023-12

与 M2 Ultra 对比

指标M3 UltraM2 Ultra提升
制程3nm5nm新代
CPU 核心32 (24P+8E)24 (16P+8E)+33%
GPU 核心8076+5%
Neural Engine72 TOPS31.6 TOPS2.3×
内存192GB LPDDR5192GB LPDDR5
带宽800 GB/s800 GB/s
CPU 性能+50%(单核 +30%)基准显著
GPU 性能+20%基准略升

本地 LLM 推理性能(192GB 版本)

模型量化性能(tok/s)备注
Llama 3 70BFP16~5-6 tok/s完整模型 ~140GB 可载
Llama 3 70BQ4_K_M~10 tok/s优化
Llama 3 8BFP16~80 tok/s极快
Mixtral 8x7BQ4_K_M~22 tok/s96GB 可载
Qwen 2.5 72BQ4_K_M~12 tok/s大上下文
Llama 3 405BQ4_K_M~2 tok/s256GB 才可载

192GB M3 Ultra 优势:单台 Mac Studio 可加载完整 70B 模型(无量化),是最便宜的本地 LLM 完整加载方案

UltraFusion 互连

  • 2.5 TB/s 芯片间互连带宽
  • 对软件透明(系统显示为单芯片)
  • CPU/GPU/Neural Engine 均可访问另一端内存

软件生态

  • MLX(Apple 官方 LLM 框架,Metal 加速)
  • llama.cpp(Metal 后端,社区主流)
  • Ollama(一键本地 LLM)
  • LM Studio(图形界面)
  • PyTorch MPS(官方 GPU 后端)
  • vLLM(Metal 后端实验性)

厂商信息

项目内容
厂商Apple
产品页https://www.apple.com/mac-studio/
Mac Studio M3 Ultra 192GB$5,899
目标市场创作者、本地 AI、ML 研究者

适用场景

  • 本地 70B LLM 完整加载(192GB UMA)
  • ✅ Stable Diffusion XL 微调
  • ✅ Final Cut Pro / Logic Pro 硬件加速
  • ✅ 端侧 LLM 开发(Apple Intelligence)
  • ❌ 数据中心训练
  • ❌ 大规模推理(缺乏数据中心硬件)

相关卡