2.3. DVFS配置

DVFS(Dynamic Voltage and Frequency Scaling,动态电压与频率调整)是一种用于在后摩设备活跃运行期间降低功耗的技术。该技术根据IPU内核实时负载需求来调整IPU内核频率。DVFS 有助于平衡设备的功耗和性能。DVFS配置通过后摩SMI工具完成。

例如,如果 AI 处理器板卡的可用最大功耗为10 W,通过 DVFS 功能,系统会根据实时负载动态调整 IPU 内核频率,以尽量控制功耗不超过设定值。通过这种方式,用户可以在保证系统性能的前提下,对功耗进行精细管理,从而提高能效并降低过热或超功耗风险。

2.3.1. 主要功能

支持功能如下:

  • 固定高性能模式 :支持后摩设备 IPU 内核始终运行在最大频率下,确保性能稳定。

  • 按需动态调整频率 :系统根据后摩设备IPU内核实时负载,自动在指定IPU内核频率范围内升降频,帮助用户在性能与功耗之间实现平衡。

  • 功耗限制模式 :根据用户设置的 AI 处理器板卡功耗范围,动态调整 IPU 内核频率,以满足功耗要求。

  • 设置 IPU 频率范围 :支持用户自定义 IPU 内核的最大与最小频率,以便自定义性能和功耗策略。

2.3.2. 前提条件

2.3.2.1. 环境依赖

  • Ubuntu 20.04、22.04、24.04

  • Windows 11

  • Kylin V11

2.3.2.2. 使用前准备

SMI工具使用前,需完成以下操作:

  1. 主机端安装驱动, SMI工具随驱动一同安装。驱动安装详情参看《后摩大道® M50驱动安装指南》。

  2. 主机端PCIe驱动已正常加载。

SMI工具详情参看《后摩大道® SMI工具使用指南》。

2.3.3. 功能设置

2.3.3.1. 设置IPU内核始终在最大频率下运行

输入下面指令,IPU内核始终在最大频率下运行:

hm_smi -g performance -a

2.3.3.1.1. 注意事项

  • IPU内核最大频率默认为1400MHz,可通过在指令中添加参数 -lc <max_freq> 来自定义 IPU 内核的最大频率。

  • 当多个终端运行 SMI 指令时,模式设置以最新执行的指令设置为准。

  • 模式设置应用于与主机连接的所有后摩设备,不支持对单个后摩设备进行设置。

2.3.3.1.2. 示例

下面示例展示如何设置当前模式为 performance

hm_smi -g performance -a

返回信息示例如下:

--------------------------------------------------------------------------------
  sdk build infos
--------------------------------------------------------------------------------
  Build_Time     : 2026-05-07 18:52:31
  HMSW_Version   : V1.3.0
  HM_SMI_Version : V1.0.0
--------------------------------------------------------------------------------
  Sat May 09 17:09:07 CST 2026
--------------------------------------------------------------------------------
  device0 detail infos
--------------------------------------------------------------------------------
  Driver_Version         : V1.3.0
  Vendor                 : Houmo
  BDF                    : 0000:01:00.0
  Dev                    : 0
  Cur_BandWidth          : 8.0 GT/s x 4lane
  Power_Management       :
    DVFS_Mode            : performance
    Cur_Ipu_Freq         : 1400.0 Mhz
    Lock_Ipu_Max_Clock   : 1400.0 Mhz
    Lock_Ipu_Min_Clock   : 700.0 Mhz
    IPU_Load             : 0.0 %
  IPU_Infos              :
    Core_Num             : 2
    Core_Freq            : 1400.0 Mhz
    Voltage              : 750.0 mV
    Core0_Util           : 0.0 %
    Core1_Util           : 0.0 %
    Average_Util         : 0.0 %
  Group_Id               : 0
  Chip_Id                : 0
  SN                     : 0102020100002025003800000059
  PN                     : 100C2010
  Model                  : LQ50-12GB
  Firmware_Version       : V1.3.0
  DDR_Memory_Infos       :
    DDR_Memory_Free      : 12160.0MB
    DDR_Memory_Total     : 12160.0MB
  Temperature            :
    DDR0                 : 20.0 C
    DDR2                 : 20.6 C
    DDR4                 : 17.1 C
    DDR5                 : 18.9 C
    Core0                : 21.5 C
    Core1                : 20.0 C
  Board_Power            : 5.35 W
--------------------------------------------------------------------------------

返回信息字段详情,参看《后摩大道® SMI工具使用指南》。

2.3.3.2. 基于 IPU 利用率的频率调整

输入下面指令,系统会根据IPU内核的实时利用率,动态调整IPU内核运行的频率,以平衡性能与功耗。

hm_smi -g ondemand -a

2.3.3.2.1. 注意事项

  • 设备断电后,再次上电时会恢复为默认模式,即IPU内核始终在最大频率下运行(performance 模式),因此需要手动重新设置为 ondemand 模式。

  • 当多个终端运行 SMI 指令时,模式设置以最新执行的指令设置为准。

  • 模式设置应用于与主机连接的所有后摩设备,不支持对单个后摩设备进行设置。

  • IPU内核频率范围默认为1400 MHz 至 700 MHz,可通过在指令中添加参数 -lc <max_freq> 来自定义 IPU 内核频率的上下限范围。

2.3.3.2.2. 示例

下面示例展示如何设置当前模式为 ondemand

hm_smi -g ondemand -a

返回信息示例如下:

--------------------------------------------------------------------------------
  sdk build infos
--------------------------------------------------------------------------------
  Build_Time     : 2026-05-07 18:52:31
  HMSW_Version   : V1.3.0
  HM_SMI_Version : V1.0.0
--------------------------------------------------------------------------------
  Sat May 09 17:09:50 CST 2026
--------------------------------------------------------------------------------
  device0 detail infos
--------------------------------------------------------------------------------
  Driver_Version         : V1.3.0
  Vendor                 : Houmo
  BDF                    : 0000:01:00.0
  Dev                    : 0
  Cur_BandWidth          : 8.0 GT/s x 4lane
  Power_Management       :
    DVFS_Mode            : ondemand
    Cur_Ipu_Freq         : 700.0 Mhz
    Lock_Ipu_Max_Clock   : 1400.0 Mhz
    Lock_Ipu_Min_Clock   : 700.0 Mhz
    IPU_Load             : 0.0 %
  IPU_Infos              :
    Core_Num             : 2
    Core_Freq            : 700.0 Mhz
    Voltage              : 750.0 mV
    Core0_Util           : 0.0 %
    Core1_Util           : 0.0 %
    Average_Util         : 0.0 %
  Group_Id               : 0
  Chip_Id                : 0
  SN                     : 0102020100002025003800000059
  PN                     : 100C2010
  Model                  : LQ50-12GB
  Firmware_Version       : V1.3.0
  DDR_Memory_Infos       :
    DDR_Memory_Free      : 12160.0MB
    DDR_Memory_Total     : 12160.0MB
  Temperature            :
    DDR0                 : 20.3 C
    DDR2                 : 20.6 C
    DDR4                 : 17.4 C
    DDR5                 : 18.9 C
    Core0                : 21.5 C
    Core1                : 20.3 C
  Board_Power            : 5.36 W
--------------------------------------------------------------------------------

返回信息字段详情,参看《后摩大道® SMI工具使用指南》。

2.3.3.3. 基于功耗阈值的频率调整

输入下面指令,系统根据设置的AI 处理器板卡功耗参考阈值,动态调整IPU内核的频率,以优化功耗表现。

hm_smi -g powerlimit -pl <max_power> <min_power> -l <sec> -a

其中:

参数说明如下:

  • <max_power> :设置用于动态调整 IPU 内核频率的最大功耗阈值。最大取值为200w。该值为调整IPU内核频率的参考功耗,与实际AI 处理器板卡的功耗限制无关。

  • <min_power> :设置用于动态调整 IPU 内核频率的最小功耗阈值。该值为调整IPU内核频率的参考功耗,与实际AI 处理器板卡的功耗限制无关。

  • <sec>:循环打印的时间间隔,单位为秒。

2.3.3.3.1. 注意事项

  • 频率调整说明:

    • IPU 内核频率动态调整的机制为:在设定的频率范围内,向上或向下切换档位。

      • 支持的IPU内核频率档位包括(单位 MHz):1400、1200、1000、850、700。

      • 实际的IPU内核频率范围默认为1400 MHz 至 700 MHz,可通过在指令中添加参数 -lc <max_freq> 来自定义 IPU 内核频率的上下限范围。

    • 如果仅设置最大功耗,最低功耗默认为最大功耗的 80%。

    • 如果当前功耗高于设置的最大功耗,系统会将 IPU 内核频率自动降低一个档位。如果频率已达到下限,则不再调整。

    • 如果当前功耗低于设置的最大功耗,且IPU内核利用率超过 90% 时,系统将 IPU 内核频率自动提高一个档位。如果频率已达到上限,则不再调整。

    • 如果当前功耗低于设置的最小功耗,IPU内核频率仍可能自动降低一个档位。

    • 如果IPU内核在最低频率下仍超出功耗限制,系统将保持最低频率。

  • 指令设置注意事项:

    • 若希望功耗设置持续有效,需保证 SMI 指令持续运行。如果当前 SMI 会话终止(正常或异常),功耗设置将会失效。若需长期保持该设置生效,可使用 -l <sec> 参数使指令以指定间隔持续执行并刷新设置。

    • 设备断电后,再次上电时需重新设置。

    • 当多个终端运行 SMI 指令时,模式设置以最新执行的指令设置为准。

    • 模式设置应用于与主机连接的所有后摩设备,不支持对单个后摩设备进行设置。

2.3.3.3.2. 示例

下面示例展示如何限制AI处理器板卡功耗范围为10W ~ 6.5W,并且每隔30秒查看所有后摩设备信息:

hm_smi -g powerlimit -pl 10w 6.5w -l 30 -a

返回信息示例如下:

--------------------------------------------------------------------------------
  sdk build infos
--------------------------------------------------------------------------------
  Build_Time     : 2026-05-07 18:52:31
  HMSW_Version   : V1.3.0
  HM_SMI_Version : V1.0.0
--------------------------------------------------------------------------------
  Sat May 09 17:10:34 CST 2026
--------------------------------------------------------------------------------
  device0 detail infos
--------------------------------------------------------------------------------
  Driver_Version         : V1.3.0
  Vendor                 : Houmo
  BDF                    : 0000:01:00.0
  Dev                    : 0
  Cur_BandWidth          : 8.0 GT/s x 4lane
  Power_Management       :
    DVFS_Mode            : powerlimit
    Cur_Ipu_Freq         : 700.0 Mhz
    Lock_Ipu_Max_Clock   : 1400.0 Mhz
    Lock_Ipu_Min_Clock   : 700.0 Mhz
    IPU_Load             : 0.0 %
    Max_Power_Limit      : 10.0 W
    Min_Power_Limit      : 6.5 W
  IPU_Infos              :
    Core_Num             : 2
    Core_Freq            : 700.0 Mhz
    Voltage              : 750.0 mV
    Core0_Util           : 0.0 %
    Core1_Util           : 0.0 %
    Average_Util         : 0.0 %
  Group_Id               : 0
  Chip_Id                : 0
  SN                     : 0102020100002025003800000059
  PN                     : 100C2010
  Model                  : LQ50-12GB
  Firmware_Version       : V1.3.0
  DDR_Memory_Infos       :
    DDR_Memory_Free      : 12160.0MB
    DDR_Memory_Total     : 12160.0MB
  Temperature            :
    DDR0                 : 19.7 C
    DDR2                 : 20.3 C
    DDR4                 : 16.8 C
    DDR5                 : 18.3 C
    Core0                : 20.9 C
    Core1                : 19.7 C
  Board_Power            : 3.38 W
--------------------------------------------------------------------------------
...

返回信息字段详情,参看《后摩大道® SMI工具使用指南》。

2.3.3.4. 设置IPU内核频率范围

输入下面指令,设置后摩设备的IPU内核频率范围:

hm_smi -lc <max_freq> <min_freq>

参数说明如下:

  • <max_freq> :IPU内核的最大频率。

  • <min_freq> :IPU内核的最小频率。

支持取值如下,单位为MHz:

  • 1400

  • 1200

  • 1000

  • 850

  • 700

默认频率范围为 1400MHz ~ 700MHz。设备断电后,再次上电时会恢复为默认值。

2.3.3.4.1. 注意事项

  • 设备断电后,再次上电时需重新设置。

  • 当多个终端运行 SMI 指令时,模式设置以最新执行的指令设置为准。

  • 模式设置应用于与主机连接的所有后摩设备,不支持对单个后摩设备进行设置。

2.3.3.4.2. 示例

下面示例展示如何设置IPU内核频率范围为1000MHz ~ 700MHz,并且查看所有后摩设备信息:

hm_smi -lc 1000 700 -a

返回信息示例如下:

--------------------------------------------------------------------------------
  sdk build infos
--------------------------------------------------------------------------------
  Build_Time     : 2026-05-07 18:52:31
  HMSW_Version   : V1.3.0
  HM_SMI_Version : V1.0.0
--------------------------------------------------------------------------------
  Sat May 09 17:11:09 CST 2026
--------------------------------------------------------------------------------
  device0 detail infos
--------------------------------------------------------------------------------
  Driver_Version         : V1.3.0
  Vendor                 : Houmo
  BDF                    : 0000:01:00.0
  Dev                    : 0
  Cur_BandWidth          : 8.0 GT/s x 4lane
  Power_Management       :
    DVFS_Mode            : performance
    Cur_Ipu_Freq         : 700.0 Mhz
    Lock_Ipu_Max_Clock   : 1000.0 Mhz
    Lock_Ipu_Min_Clock   : 700.0 Mhz
    IPU_Load             : 0.0 %
  IPU_Infos              :
    Core_Num             : 2
    Core_Freq            : 700.0 Mhz
    Voltage              : 750.0 mV
    Core0_Util           : 0.0 %
    Core1_Util           : 0.0 %
    Average_Util         : 0.0 %
  Group_Id               : 0
  Chip_Id                : 0
  SN                     : 0102020100002025003800000059
  PN                     : 100C2010
  Model                  : LQ50-12GB
  Firmware_Version       : V1.3.0
  DDR_Memory_Infos       :
    DDR_Memory_Free      : 12160.0MB
    DDR_Memory_Total     : 12160.0MB
  Temperature            :
    DDR0                 : 22.4 C
    DDR2                 : 23.0 C
    DDR4                 : 20.0 C
    DDR5                 : 21.5 C
    Core0                : 23.9 C
    Core1                : 22.4 C
  Board_Power            : 5.34 W
--------------------------------------------------------------------------------

返回信息字段详情,参看《后摩大道® SMI工具使用指南》。

2.3.3.4.3. 注意事项