3. 热管理

后摩M50设备采用专门的热设解决方案,以确保设备在各种工作负载下的长期可靠性和稳定性。该设计能够在高强度应用运行时,有效控制器件温度,使其保持在规定的安全范围内,防止因过热导致的性能下降或器件损坏。

3.1. 过温保护策略

后摩设备内置软件过温保护机制,用于防止设备温度超过安全阈值。其核心目的是降低芯片温度,保障设备在长时间运行下的稳定性和安全性。当监测到温度达到设定阈值时,系统会自动采取降频等措施,以减少发热并控制温度上升。

表 3.1 过温保护策略

温度阈值

保护方式

描述

100°C

软件调频

当后摩设备温度达到阈值时,系统会自动触发降频机制,以降低功耗并控制温度上升:

  • 系统会降低IPU内核频率至850MHz。

  • 系统会逐步降低IPU内核频率。

  • 若温度仍未下降,系统会进一步降低IPU内核及相关组件的频率。

  • 整个降频过程分阶段执行,直至温度稳定在安全范围内。

  • 当温度恢复到安全范围后,系统会根据DVFS策略自动恢复频率。

104°C

系统重启

当后摩设备温度达到阈值时,系统将自动重启,以防止过热造成硬件损坏。

用户可通过后摩SMI工具查询后摩设备IPU内核和DDR当前温度。详情参看《后摩大道® SMI工具使用指南》。

3.1.1. 注意事项

不支持调整后摩设备的温度阈值、降频机制及过温保护的触发策略。