M50量化工具用户手册
1.3.0

目录

  • 1. 更新历史
  • 2. 简介
  • 3. 快速入门
  • 4. 图像数据预处理
  • 5. PTQ量化
  • 6. LLM和多模态模型量化
  • 7. 主要接口
  • 8. 示例代码
  • 版权声明
M50量化工具用户手册
  • »
  • 后摩大道® M50 HMQuantool量化工具用户手册

后摩大道® M50 HMQuantool量化工具用户手册

目录

  • 1. 更新历史
  • 2. 简介
    • 2.1. 主要功能
    • 2.2. 特性
    • 2.3. 量化流程
  • 3. 快速入门
    • 3.1. 系统要求
    • 3.2. 环境依赖
    • 3.3. 安装和部署
  • 4. 图像数据预处理
    • 4.1. 功能说明
      • 4.1.1. 功能限制
      • 4.1.2. 输入图像规格
      • 4.1.3. 输出图像规格
    • 4.2. 图像预处理操作
      • 4.2.1. 图像尺寸固定的场景
      • 4.2.2. 图像尺寸可变的场景
  • 5. PTQ量化
    • 5.1. 量化策略
      • 5.1.1. 尾数位量化
      • 5.1.2. 量化格式
        • 5.1.2.1. SSFP
        • 5.1.2.2. SEFP
    • 5.2. 量化基本流程
  • 6. LLM和多模态模型量化
    • 6.1. 开发流程
  • 7. 主要接口
    • 7.1. APIs
      • 7.1.1. convert_onnx_to_hmonnx
      • 7.1.2. create_quant_config
      • 7.1.3. get_root_logger
      • 7.1.4. xhquant_init
      • 7.1.5. HMONNXGoldenInference
    • 7.2. Classes
      • 7.2.1. Class DeviceType
      • 7.2.2. Class LLMConverter
        • 7.2.2.1. from_pretrained
      • 7.2.3. Class MemoryTracker
        • 7.2.3.1. __init__
      • 7.2.4. Class QuantScheme
      • 7.2.5. Class Qwen2ConvertConfig
      • 7.2.6. Class Qwen2VLConvertConfig
      • 7.2.7. Class SD3ConvertConfig
      • 7.2.8. Class SD3Converter
        • 7.2.8.1. from_pretrained
      • 7.2.9. Class ResizerScheme
      • 7.2.10. Class TimeProfiler
        • 7.2.10.1. __init__
      • 7.2.11. Class VisualConfig
  • 8. 示例代码
    • 8.1. ResNet50模型量化示例
    • 8.2. YOLOv8模型量化示例
    • 8.3. Qwen3-14B模型量化示例
    • 8.4. Qwen2VL多模态模型量化示例
    • 8.5. Stable Diffusion 3模型量化示例
下一页

© 版权所有 2026, HOUMO.

利用 Sphinx 构建,使用了 主题 由 Read the Docs开发.