2. 简介

Profiler 性能调试工具用于在推理过程中,收集和记录后摩硬件IPU内核上执行指令的性能数据,和后摩硬件设备的 DDR 平均带宽和峰值带宽。该工具通过可视化图表方式展示每个指令在IPU内核各单元上的性能,以及 DDR 带宽利用率,帮助用户深入分析并优化 IPU 内核的性能表现和 DDR 的性能表现。

2.1. IPU内核说明

后摩 IPU(Intelligence Processing Unit,处理器架构)是一种高度并行处理器架构,用于加速主流神经网络计算。如下图所示,1个SoC上最多有2个IPU内核,每个IPU内核集成4个tile,每个tile内部集成RISC‑V处理器来执行指令和计算。IPU内核上运行的指令包括 RISC‑V 指令和 IPU 内核指令。

Profiler性能调试工具以tile为单位,收集和展示运行在每个tile上的每个指令的性能数据。

../_images/ipu_m50.png

图 2.1 IPU内核说明

3. 环境准备

3.1. 环境依赖

Profiler性能调试工具目前仅支持在Linux主机端Ubuntu 24.04 X86使用。

3.2. 运行环境

软件平台提供的Docker镜像内置了运行Profiler性能调试工具的环境。该工具存放在 /usr/local/houmo/bin 目录下。有关Docker镜像的安装与部署,参看《后摩大道® M50 软件平台快速入门》。