跳到主要内容

AWS Inferentia (第一代)

产品概述

AWS Inferentia 是 Amazon Annapurna Labs 设计的 AI 推理 ASIC,2019 年发布。128 TOPS INT8 算力,35W TDP 低功耗。通过 Inf1 实例 提供。

核心规格

项目参数
架构Inferentia(NeuronCore-v1)
NeuronCore4 颗/芯片
INT8 算力128 TOPS
FP16/BF1664 TFLOPS
TDP35 W
形式Inf1 实例

厂商信息

项目内容
制造商Amazon (Annapurna Labs)
官网https://aws.amazon.com/machine-learning/inferentia/
产品页https://aws.amazon.com/ec2/instance-types/inf1/
SDKhttps://awsdocs-neuron.readthedocs-hosted.com/

适用场景

  • 低延迟 AI 推理
  • 推荐系统
  • NLP 推理

相关产品对比