晶圆级 AI 训练超算

晶圆级（Wafer-Scale）AI 训练芯片是将整片晶圆作为一个处理器的革命性架构，规避了传统 GPU 多芯片互联的瓶颈。Cerebras 和 Tesla Dojo 是这一领域的两大代表。

主流晶圆级训练系统

型号	厂商	晶体管数	核心数	片上 SRAM	算力 (FP16 稀疏)	系统算力	状态
Cerebras WSE-4 (CS-4, 推测)	Cerebras	~5 万亿	~1,500,000	~80GB	~200 PFLOPS	~200 PFLOPS	2027 预计
Cerebras WSE-3 (CS-3)	Cerebras	4 万亿	900,000	44GB	125 PFLOPS	125 PFLOPS	2024
Cerebras WSE-2 (CS-2)	Cerebras	2.6 万亿	850,000	40GB	~62 PFLOPS	~62 PFLOPS	2021
Tesla Dojo ExaPOD	Tesla	180,000 亿 (360× D1)	127,440	N/A	N/A	100 EFLOPs	2023
Tesla Dojo Cabinet	Tesla	3,000 亿 (6× D1 Tile)	2,124	N/A	N/A	~1.7 EFLOPs	2023
Tesla Dojo D1	Tesla	500 亿	354	N/A	36.7 TFLOPS (BF16)	—	2022

指标	WSE-2 (CS-2)	WSE-3 (CS-3)	WSE-4 (CS-4, 推测)
制程	TSMC 7nm	TSMC 5nm	TSMC 3nm
晶体管	2.6 万亿	4 万亿	~5 万亿
核心数	850,000	900,000	~1,500,000
片上 SRAM	40GB	44GB	~80GB
FP16 稀疏算力	~62 PFLOPS	125 PFLOPS	~200 PFLOPS
系统 TDP	15 kW	15 kW	~30 kW
发布时间	2021	2024	2027 预计