Skip to main content

Hailo-8 / Hailo-8L / Hailo-15 边缘 AI 加速器

产品概述

Hailo 是以色列 Hailo Technologies 推出的边缘 AI 推理加速器,专为计算机视觉多模态 LLM 设计。Hailo-8(2019 发布,26 TOPS)已商用部署于 NVIDIA Jetson Orin 替代方案、Raspberry Pi AI Kit、智能摄像头、工业视觉等场景。

最新产品为 Hailo-15(2024 发布,集成 VPU + AI 加速器,单芯片视觉 AI 处理器)。

产品线对比

项目Hailo-8Hailo-8LHailo-15-15Hailo-15-30
INT8 算力26 TOPS13 TOPS20 TOPS40 TOPS
制程TSMC 14nmTSMC 14nmTSMC 7nmTSMC 7nm
TDP2.5 W1.5 W6 W9 W
效率10.4 TOPS/W8.7 TOPS/W3.3 TOPS/W4.4 TOPS/W
内存4GB LPDDR44GB LPDDR4集成 VPU + 4GB集成 VPU + 8GB
形态M.2 / mPCIe / BGAM.2 / BGASoC(含 ISP/VPU)SoC
首发2019202020242024

Hailo-15 集成 ISP(图像信号处理器)+ VPU(视频编解码)+ AI 加速器,单芯片替代多芯片方案。

架构亮点

数据流架构(Dataflow Architecture)

  • 类 Cerebras WSE 的空间架构,权重驻留片上 SRAM。
  • 无外部内存访问延迟(CV 模型全部驻留)。
  • 确定性延迟:单张图推理延迟 < 5 ms(ResNet-50)。

模型压缩

  • Hailo Dataflow Compiler 自动量化(INT8/INT4/混合精度)。
  • 支持剪枝、层融合、内存优化。
  • 模型压缩率 ~3-5×(FP32 → INT8)且精度损失小于 1%。

多模型并行

  • 单卡可同时跑多个模型(如检测+分类+分割)。
  • 硬件资源分片,隔离性强。

软件生态

工具链

  • Hailo Dataflow Compiler(HDF → HAR 转换)
  • Hailo Model Zoo(30+ 预训练模型,含 YOLOv5/v8、ResNet、EfficientNet)
  • HailoRT(运行时,C/C++/Python API)
  • Hailo Python API(gRPC 风格)

框架

  • TensorFlow / PyTorch / ONNX(导出后编译)
  • GStreamer(视频流集成)
  • ROS(机器人)

操作系统

  • Linux(ARM/x86)
  • Windows(部分型号)
  • 集成于 NVIDIA JetPack(替代 GPU 加速)

部署案例

  • Hailo-8 M.2 + Raspberry Pi 5 — 13 TOPS AI Kit($70)
  • 智能摄像头(Axis、奇虎 360)— 边缘视频分析
  • 工业视觉(产线缺陷检测)
  • 自动驾驶(Tier 1 供应商 ADAS 前视)
  • 机器人(服务机器人视觉 SLAM)

性能基准(YOLOv5s 640×640)

设备FPS延迟TDP
Hailo-8600 FPS1.7 ms2.5 W
Hailo-8L300 FPS3.3 ms1.5 W
NVIDIA Jetson Orin Nano 8GB125 FPS8 ms7-15 W
NVIDIA Jetson Xavier NX90 FPS11 ms10-20 W
CPU (i7-12700H)25 FPS40 ms45 W

Hailo-8 在 YOLOv5s 上比 Jetson Xavier NX 快 6.7×,功耗低 4-8×

厂商信息

项目内容
厂商Hailo Technologies(以色列)
产品页https://hailo.ai/
售价Hailo-8 M.2: $200 / Hailo-8L: $150 / Hailo-15 套件: $300+
融资C 轮 $136M(2023-04,总融资 $340M)
目标市场边缘 AI、智能摄像头、工业视觉、机器人

适用场景

  • 边缘视觉 AI 推理(摄像头、机器人)
  • ✅ 工业视觉(产线检测)
  • ✅ ADAS(高级驾驶辅助)
  • ✅ 边缘 LLM(Phi-3、Llama 2 7B 量化)
  • ❌ 大模型训练
  • ❌ 数据中心推理(NV H100 性能/瓦特更优)

相关卡