6. ModelZoo模型库

后摩大道® M50软件平台ModelZoo提供了帮助用户在Linux系统上快速移植模型到后摩设备上的模型合集,其中包括量化、编译、推理、精度和性能评估等一套完整的代码和工具。开发者可以参考ModelZoo源代码做二次开发。

注意

  • ModelZoo提供的模型示例仅用于帮助用户快速了解和使用 后摩大道® M50 软件平台。如果想要达到更好的网络性能,仍需要调整和优化。

  • 在Ubuntu 22.04 x86_64、Ubuntu 20.04 x86_64和Ubuntu 20.04 AArch64平台上,ModelZoo模型开发样例为受限支持。上述平台不支持模型量化和模型编译能力,因此样例中涉及量化、编译的脚本或流程不适用于这些平台。

ModelZoo位于 应用开发示例包(示例代码)houmo-examples_<release>/houmo-examples/models 目录下。使用 MODELZOO_PATH 环境变量表示ModelZoo所在路径。

ModelZoo模型库仅部分模型示例支持在后摩M50系列产品上运行,下面目录结构仅展示支持的模型示例:

|-- models    # ModelZoo网络模型示例,包括各网络模型编译、推理、性能评估的运行脚本等。
|   |-- asr                      # 自动语音识别相关网络模型
|   |   |-- glm-asr              # 中文场景专用通用语音识别模型
|   |   |-- qwen3-asr            # 通用语音识别模型
|   |   |-- sensevoice           # 语音识别、情感识别和语音事件检测模型
|   |   |-- whisper-turbo        # 高速语音识别与多语言转录模型
|   |   `-- whisper              # 多语种全局通用语音识别模型
|   |-- autodrive                # 自动驾驶相关网络模型
|   |   `-- yolop                # YOLOP网络模型
|   |-- backbone                 # Backbone网络模型
|   |   |-- efficientnet         # EfficientNet网络模型
|   |   |-- mobilenetv2          # MobileNetV2网络模型
|   |   |-- resnet50             # ResNet50网络模型
|   |   |-- yolov8m-cls          # YOLOv8m 的图像分类模型
|   |   `-- ViT-B-16             # Vision Transformer网络模型
|   |-- detection                # 检测网络模型
|   |   |-- yolov3               # YOLOv3网络模型
|   |   |-- yolov5s              # YOLOv5s网络模型(含动态裁剪功能)
|   |   |-- yolov5s_feature      # YOLOv5s网络模型(无动态裁剪功能)
|   |   |-- yolov7               # YOLOv7网络模型
|   |   |-- yolov8m              # YOLOv8m网络模型
|   |   |-- yolov9m              # YOLOv9m网络模型
|   |   |-- yolov10m             # YOLOv10m网络模型
|   |   |-- yolo11m              # YOLO11m网络模型
|   |   |-- yolo12m              # YOLO12m网络模型
|   |   |-- yolov5m_face         # YOLOv5m人脸检测模型
|   |   |-- yolox                # YOLOX网络模型
|   |   `-- yolo26m              # YOLO26m网络模型
|   |-- embedding                # 嵌入模型
|   |   |-- qwen3-embedding      # 文本向量化模型
|   |   |-- bge                  # BGE信息检索模型
|   |   `-- gte                  # GTE信息检索模型
|   |-- estimation               # 实时人体姿态估计相关网络模型
|   |   `-- yolov8m-pose         # 评估网络模型
|   |-- llm                      # 大语言模型
|   |   |-- CoPaw-Flash          # 端侧智能体小模型
|   |   |-- deepseek-r1-qwen3-8b # DeepSeek-R1-0528-Qwen3-8B模型
|   |   |-- gpt-oss              # GPT-OSS 模型
|   |   |-- qwen2.5              # Qwen2.5-7B模型
|   |   |-- qwen3                # Qwen3模型,包括8B、14B、0.6B和1.7B
|   |   |-- qwen3-30b-a3b        # Qwen3-30B-a3B模型
|   |   `-- qwen3.5              # Qwen3.5模型,包括0.8B、2B、4B、9B、
|   |                            # 27B、35B-A3B,和Qwen3.6-35B-A3B
|   |                            # 和Qwen3.6-27B模型
|   |-- ocr                      # 深度学习的图像文字识别模型(基于OCR)
|   |   |-- glm-ocr              # 文本识别模型
|   |   |-- lprnet               # 车牌识别网络模型
|   |   `-- PPOCRv3              # PaddlePaddle开源的一套OCR模型
|   |-- omni                     # 多模态大型语言模型
|   |   `-- minicpmo             # MiniCPMO模型
|   |-- reranker                 # 重排序模型
|   |   `-- qwen3-reranker       # 基于语义相关性的检索结果重排序模型
|   |-- segmentation             # 图像分割相关网络模型
|   |   `-- yolov8m_seg          # YOLOv8m图像分割网络模型
|   |-- tts                      # 语音合成模型
|   |  `-- cosyvoice3            # CosyVoice3语音合成模型
|    `-- vlm                     # 多模态和高性能大模型推理加速引擎
|   |   |-- qwen2.5-vl           # Qwen2.5多模态视觉语言模型
|   |   |-- gemma4               # Gemma4开源权重多模态大模型
|       `-- qwen3-vl             # Qwen3多模态视觉语言模型
|-- data                         # 模型和数据集
|-- hmodel                       # 量化模型配置和工具
|-- requirements.txt             # Python环境依赖
`-- env.sh                       # ModelZoo环境变量配置脚本