4. 指令说明

部署环境检测工具脚本如下:

  • Linux / Android 系统:

    hm-check
    

该脚本位于 houmo-examples-xh2/tools/hm_check/build 目录下。

  • Windows系统:

    hm-check.exe
    

该脚本位于 houmo-examples-xh2\tools\hm_check\build\Release 目录下。

5. 性能指标说明

部署环境检测工具执行完成后,会依次输出多项性能测试结果及系统环境校验报告,用于综合评估 后摩漫界® M50 芯片的部署环境是否符合运行要求。输出信息主要包括以下几个部分。

5.1. Computing Power Test(算力测试)

工具返回的算力测试信息示例如下:

===== Computing Power Test =====
[INFO] Infer 0 started, wramup: 1, rounds: 1, repeat: 32
[INFO] Infer 1 started, wramup: 1, rounds: 1, repeat: 32
[INFO] Infer 2 started, wramup: 1, rounds: 1, repeat: 32
[INFO] Infer 3 started, wramup: 1, rounds: 1, repeat: 32
Device 0 Computing Power: 81.15 TOPS
=============================

该部分用于测量芯片在当前部署环境下的实际推理算力表现。

  • Infer X started:表示并行启动的推理实例编号。多个推理实例用于充分利用芯片计算资源。

  • warmup:预热轮次,用于消除首次推理带来的初始化开销。

  • rounds:单次测试中执行的推理轮数。

  • repeat:重复执行次数,用于取稳定的统计结果。

  • Computing Power:表示当前后摩设备实测算力,单位为 TOPS。

该值用于与芯片标称算力或验收阈值进行对比。

5.2. DDR Bandwidth Test(DDR 带宽测试)

工具返回的DDR 带宽测试信息示例如下:

===== DDR Bandwidth Test =====
[INFO] Infer 0 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 1 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 2 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 3 started, wramup: 1, rounds: 100, repeat: 2
Device 0 DDR Read Bandwidth: 123.64 GB/s
[INFO] Infer 0 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 1 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 2 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 3 started, wramup: 1, rounds: 100, repeat: 2
Device 0 DDR Write Bandwidth: 116.27 GB/s
=============================

该部分用于检测芯片访问 DDR 内存的读写带宽能力。

  • Infer X started:表示并行执行的测试实例编号。多个推理实例同时运行,用于模拟多并发访问 DDR 的场景,以更真实地反映芯片在高负载条件下的内存带宽能力。

  • warmup:预热轮次,在正式统计带宽数据之前,先执行指定次数的访问操作,用于消除缓存初始化、调度延迟等非稳定因素对测试结果的影响。

  • rounds:单次测试中执行的推理轮数。该值越大,单次测试持续时间越长,测试结果的稳定性和统计可靠性越高。

  • repeat:测试重复次数。工具会多次执行同一组参数配置的测试,并对结果进行统计汇总,用于减少偶发波动对最终带宽结果的影响。

  • DDR Read Bandwidth:表示芯片从 DDR 读取数据的实测带宽。

  • DDR Write Bandwidth:芯片向 DDR 写入数据的实测带宽。

该测试反映内存子系统性能,对高吞吐模型和多并发推理场景尤为关键。

5.3. PCIe Bandwidth Test(PCIe 带宽测试)

工具返回的PCIe 带宽测试信息示例如下:

===== PCIE Bandwidth Test =====
Device 0 PCIE H2D Bandwidth: 3.03 GB/s
Device 0 PCIE D2H Bandwidth: 1.65 GB/s
=============================

该部分用于评估主机与设备之间通过 PCIe 接口进行数据传输的性能。

  • PCIE H2D Bandwidth:表示主机端到后摩设备端方向的传输带宽。

  • PCIE D2H Bandwidth:后摩设备端到主机端方向的传输带宽。

5.4. System Check Report(系统环境校验报告)

工具返回的系统环境校验报告信息示例如下:

=== System Check Report ===
  Driver Version                 [PASS]   v0.7.0
  SDK Version                    [PASS]   v0.7.0
  Runtime Version                [PASS]   v0.7.0
  Device0 Firmware Version       [PASS]   v0.7.0
  Version Consistency            [PASS]   Match                 Maybe cause unknown problems.
  Device0 Cur IPU Freq           [PASS]   1400.00 MHz
  Device0 Measured Compute       [PASS]   81.15 TOPS
  Device0 Measured DDR Read      [PASS]   123.64 GB/s
  Device0 Measured DDR Write     [PASS]   116.27 GB/s
  Device0 Measured PCIe H2D      [WARN]   3.03 GB/s             The PCIE transfer bandwidth should not be less than 3.94 GB/s * 0.80
  Device0 Measured PCIe D2H      [WARN]   1.65 GB/s             The PCIE transfer bandwidth should not be less than 3.94 GB/s * 0.80
===========================

该部分用于对当前部署环境的关键软件版本、硬件参数及实测性能指标进行逐项校验,并给出每一项的检查结果。

  • Driver Version:表示当前系统中安装的驱动版本。

  • SDK Version:当前使用的 SDK 版本。

  • Runtime Version:当前 Runtime 库版本。

  • Firmware Version:当前后摩设备上运行的固件版本。

  • Version Consistency:驱动、SDK、Runtime 与固件之间的版本一致性检查。

  • Cur IPU Freq:当前芯片实际运行主频。

  • Measured Compute:实测算力,对应 Computing Power Test 的测试结果。

  • Measured DDR Read:实测 DDR 读带宽,对应 DDR Bandwidth Test 的测试结果。

  • Measured DDR Write:实测 DDR 写带宽,对应 DDR Bandwidth Test 的测试结果。

  • Device0 Measured PCIe H2D:实测 PCIe 主机到后摩设备的传输带宽,对应 PCIe Bandwidth Test 的测试结果。

  • Device0 Measured PCIe D2H:实测 PCIe 后摩设备到主机的传输带宽,对应 PCIe Bandwidth Test 的测试结果。

5.5. Check Summary(检测结果汇总)

工具返回的检测结果汇总信息示例如下:

===== Check Summary =====
  PASS : 9
  WARN : 2
  FAIL : 0
=========================

该部分用于对 System Check Report 中的所有校验项进行结果统计与汇总,帮助用户快速了解整体部署环境状态。

  • PASS:通过校验的检查项数量。

  • WARN:存在潜在风险的检查项数量。

  • FAIL:未通过校验的检查项数量。