5. 已修复问题

  • 在 Ubuntu 24.04 环境下,应用开发示例包中Qwen3.5-9B 256K模型示例编译失败。该问题已修复。

  • 在 Qwen3.5 示例中,量化、编译后的模型在 Vision 模式下可能出现推理精度较低的问题。该问题已修复。

  • Qwen3-32B Prefill-512 模型在处理长输入问题时,回答可能出现乱码。该问题已修复。

  • 在openEuler 24.03环境下安装驱动时,可能因依赖验证失败导致安装报错,需要手动安装相关依赖。该问题已修复。

  • 在Ubuntu 24.04环境下,应用开发示例包中 GLM-ASR 模型示例编译失败。该问题已修复。

  • 在AArch64环境下,安装驱动后执行SMI工具或使用 hm_upgrade_cli 指令升级固件时,可能返回 please install driver 错误。该问题已修复。

  • 在GPU环境下,应用开发示例包中 MiniCPM-o Visual 模型示例编译失败。该问题已修复。

  • 应用开发示例包中 Qwen3-VL 30B A3B 8K 448x448 模型推理性能下降。该问题已修复。

  • 在连续加载 Qwen3-35B A3B 和 Qwen3-8B 模型后,模型均加载成功,但执行推理时可能失败。该问题已修复。

  • 在 Ubuntu 24.04 环境下,Runtime安装包遗漏NumPy依赖,可能导致相关功能运行异常。该问题已修复。

  • 投机解码示例的推理加速比可能未达到 1.2。该问题已修复。

  • 在Ubuntu 20.04 x86 境下,连续多次加载同一个模型时,首次加载耗时较长。该问题已修复。