M50 软件平台快速入门
1.3.0

目录

  • 1. 更新历史
  • 2. 简介
  • 3. 安装与部署
  • 4. 使用流程
  • 5. 应用开发实践
  • 6. ModelZoo模型库
    • 6.1. 样例说明
    • 6.2. 环境准备
    • 6.3. 模型获取
    • 6.4. 数据集准备
    • 6.5. 样例运行
    • 6.6. LLM样例
      • 6.6.1. 样例介绍
      • 6.6.2. Qwen3模型样例运行
      • 6.6.3. 性能评测指标
  • 7. 开发样例
  • 8. 版本发布信息
  • 版权声明
M50 软件平台快速入门
  • »
  • 6. ModelZoo模型库 »
  • 6.6. LLM样例

6.6. LLM样例

  • 6.6.1. 样例介绍
    • 6.6.1.1. 特别说明
  • 6.6.2. Qwen3模型样例运行
    • 6.6.2.1. 模型推理验证
    • 6.6.2.2. 完整开发流程:从开源模型到设备推理
      • 6.6.2.2.1. 软硬件环境要求
      • 6.6.2.2.2. 开发流程
      • 6.6.2.2.3. 准备量化和编译开发环境
      • 6.6.2.2.4. 下载Qwen3-8B模型
      • 6.6.2.2.5. 量化模型
      • 6.6.2.2.6. 编译模型
  • 6.6.3. 性能评测指标
    • 6.6.3.1. 背景知识
    • 6.6.3.2. 评测指标
    • 6.6.3.3. 首Token延迟及TPS
    • 6.6.3.4. 每个输出token的延迟及TPS
    • 6.6.3.5. 端到端延迟及TPS
上一页 下一页

© Copyright 2026, HOUMO.

利用 Sphinx 构建,使用了 主题 由 Read the Docs开发.