简介

芯片算力基准测试工具用于对后摩漫界^® M50 芯片AI 加速器的峰值推理算力进行评估。

评测方法采用微基准测试模型，并构建了一个由多层卷积 (Convolutional) 算子组成的 ONNX 标准模型。该负载设计旨在生成高计算密度，确保最大限度地激活目标芯片的计算引擎，以逼近芯片的理论峰值。

评测过程采用多线程并发方式，执行预设数量的样本推理，并测量其总运行时间。最终基于模型的单样本理论浮点运算次数和总运行时间，计算出芯片在 INT8或BFP16 格式下的实际有效算力。

性能说明

所计算的实际有效算力通常会低于芯片的理论峰值。这是由于总运行时间的统计是在主机 CPU 端完成的，其中包含但不限于以下关键的非计算开销：

因此，实际有效算力代表的是端到端（包含数据搬运）的综合性能表现。

本测试支持Linux X86及Linux AArch64平台：

Linux X86平台： 本测试将生成一个包含若干层卷积的ONNX模型，编译该模型并在芯片上推理，统计模型运行时间，最终计算得到芯片运行该模型的算力。
Linux AArch64平台： 本测试将下载一个包含若干层卷积的预编译模型，在芯片上推理该模型，统计模型运行时间，最终计算得到芯片运行该模型的算力。该平台不支持执行包含模型编译步骤的完整测试流程。如需在该平台使用本工具，请设置 --skip-build 参数，跳过模型编译步骤，仅执行模型推理。

注意

建议使用M50 芯片V2版本进行算力测试。

软件平台提供的Docker镜像包含工具运行环境。有关Docker镜像的安装与部署，参看《软件平台驱动安装指南》。

工具使用前，执行下面指令配置运行环境：

下载应用开发示例包。
将应用开发示例包拷贝到可运行环境。
在 houmo-examples-xh2 目录下，执行下面命令设置环境变量：
```
source env.sh
```
在工具所在目录运行相关指令。该工具位于应用开发示例包 houmo-examples-<target_hw>_<release>.zip 中 houmo-examples-xh2/tools/computing_perf 目录下。

执行下面步骤在主机端下载应用开发示例包：

登录后摩开发者社区。
在 请先选择板级类别 下拉列表中选择使用的后摩板级产品。
在版本列表中选择下载的版本号，再在 AI模型类别筛选器 、平台架构筛选器 、操作系统筛选器 下拉菜单中分别选择AI模型类型、平台架构和操作系统，找到资源名为示例代码的下载资源，选中该资源左边复选框。
点击 直接下载、wget链接、批量直接下载 或 wget批量下载 按钮，下载应用开发示例包。