4. 指令说明
部署环境检测工具脚本如下:
Linux / Android 系统:
hm-check
该脚本位于 houmo-examples-xh2/tools/hm_check/build 目录下。
Windows系统:
hm-check.exe
该脚本位于 houmo-examples-xh2\tools\hm_check\build\Release 目录下。
5. 性能指标说明
部署环境检测工具执行完成后,会依次输出多项性能测试结果及系统环境校验报告,用于综合评估 后摩漫界® M50 芯片的部署环境是否符合运行要求。输出信息主要包括以下几个部分。
5.1. Computing Power Test(算力测试)
工具返回的算力测试信息示例如下:
===== Computing Power Test =====
[INFO] Infer 0 started, wramup: 1, rounds: 1, repeat: 32
[INFO] Infer 1 started, wramup: 1, rounds: 1, repeat: 32
[INFO] Infer 2 started, wramup: 1, rounds: 1, repeat: 32
[INFO] Infer 3 started, wramup: 1, rounds: 1, repeat: 32
Device 0 Computing Power: 81.15 TOPS
=============================
该部分用于测量芯片在当前部署环境下的实际推理算力表现。
Infer X started:表示并行启动的推理实例编号。多个推理实例用于充分利用芯片计算资源。warmup:预热轮次,用于消除首次推理带来的初始化开销。rounds:单次测试中执行的推理轮数。repeat:重复执行次数,用于取稳定的统计结果。Computing Power:表示当前后摩设备实测算力,单位为 TOPS。
该值用于与芯片标称算力或验收阈值进行对比。
5.2. DDR Bandwidth Test(DDR 带宽测试)
工具返回的DDR 带宽测试信息示例如下:
===== DDR Bandwidth Test =====
[INFO] Infer 0 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 1 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 2 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 3 started, wramup: 1, rounds: 100, repeat: 2
Device 0 DDR Read Bandwidth: 123.64 GB/s
[INFO] Infer 0 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 1 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 2 started, wramup: 1, rounds: 100, repeat: 2
[INFO] Infer 3 started, wramup: 1, rounds: 100, repeat: 2
Device 0 DDR Write Bandwidth: 116.27 GB/s
=============================
该部分用于检测芯片访问 DDR 内存的读写带宽能力。
Infer X started:表示并行执行的测试实例编号。多个推理实例同时运行,用于模拟多并发访问 DDR 的场景,以更真实地反映芯片在高负载条件下的内存带宽能力。warmup:预热轮次,在正式统计带宽数据之前,先执行指定次数的访问操作,用于消除缓存初始化、调度延迟等非稳定因素对测试结果的影响。rounds:单次测试中执行的推理轮数。该值越大,单次测试持续时间越长,测试结果的稳定性和统计可靠性越高。repeat:测试重复次数。工具会多次执行同一组参数配置的测试,并对结果进行统计汇总,用于减少偶发波动对最终带宽结果的影响。DDR Read Bandwidth:表示芯片从 DDR 读取数据的实测带宽。DDR Write Bandwidth:芯片向 DDR 写入数据的实测带宽。
该测试反映内存子系统性能,对高吞吐模型和多并发推理场景尤为关键。
5.3. PCIe Bandwidth Test(PCIe 带宽测试)
工具返回的PCIe 带宽测试信息示例如下:
===== PCIE Bandwidth Test =====
Device 0 PCIE H2D Bandwidth: 3.03 GB/s
Device 0 PCIE D2H Bandwidth: 1.65 GB/s
=============================
该部分用于评估主机与设备之间通过 PCIe 接口进行数据传输的性能。
PCIE H2D Bandwidth:表示主机端到后摩设备端方向的传输带宽。PCIE D2H Bandwidth:后摩设备端到主机端方向的传输带宽。
5.4. System Check Report(系统环境校验报告)
工具返回的系统环境校验报告信息示例如下:
=== System Check Report ===
Driver Version [PASS] v0.7.0
SDK Version [PASS] v0.7.0
Runtime Version [PASS] v0.7.0
Device0 Firmware Version [PASS] v0.7.0
Version Consistency [PASS] Match Maybe cause unknown problems.
Device0 Cur IPU Freq [PASS] 1400.00 MHz
Device0 Measured Compute [PASS] 81.15 TOPS
Device0 Measured DDR Read [PASS] 123.64 GB/s
Device0 Measured DDR Write [PASS] 116.27 GB/s
Device0 Measured PCIe H2D [WARN] 3.03 GB/s The PCIE transfer bandwidth should not be less than 3.94 GB/s * 0.80
Device0 Measured PCIe D2H [WARN] 1.65 GB/s The PCIE transfer bandwidth should not be less than 3.94 GB/s * 0.80
===========================
该部分用于对当前部署环境的关键软件版本、硬件参数及实测性能指标进行逐项校验,并给出每一项的检查结果。
Driver Version:表示当前系统中安装的驱动版本。SDK Version:当前使用的 SDK 版本。Runtime Version:当前 Runtime 库版本。Firmware Version:当前后摩设备上运行的固件版本。Version Consistency:驱动、SDK、Runtime 与固件之间的版本一致性检查。Cur IPU Freq:当前芯片实际运行主频。Measured Compute:实测算力,对应 Computing Power Test 的测试结果。Measured DDR Read:实测 DDR 读带宽,对应 DDR Bandwidth Test 的测试结果。Measured DDR Write:实测 DDR 写带宽,对应 DDR Bandwidth Test 的测试结果。Device0 Measured PCIe H2D:实测 PCIe 主机到后摩设备的传输带宽,对应 PCIe Bandwidth Test 的测试结果。Device0 Measured PCIe D2H:实测 PCIe 后摩设备到主机的传输带宽,对应 PCIe Bandwidth Test 的测试结果。
5.5. Check Summary(检测结果汇总)
工具返回的检测结果汇总信息示例如下:
===== Check Summary =====
PASS : 9
WARN : 2
FAIL : 0
=========================
该部分用于对 System Check Report 中的所有校验项进行结果统计与汇总,帮助用户快速了解整体部署环境状态。
PASS:通过校验的检查项数量。WARN:存在潜在风险的检查项数量。FAIL:未通过校验的检查项数量。