6. ModelZoo模型库

后摩大道^® M50软件平台ModelZoo提供了帮助用户在Linux系统上快速移植模型到后摩设备上的模型合集，其中包括量化、编译、推理、精度和性能评估等一套完整的代码和工具。开发者可以参考ModelZoo源代码做二次开发。

注意

ModelZoo提供的模型示例仅用于帮助用户快速了解和使用后摩大道^® M50 软件平台。如果想要达到更好的网络性能，仍需要调整和优化。
在x86_64推理部署镜像（deploy镜像）和AArch64 推理部署镜像中，ModelZoo模型开发样例为受限支持。上述平台不支持模型量化和模型编译能力，因此样例中涉及量化、编译的脚本或流程不适用于这些平台。

ModelZoo位于应用开发示例包（示例代码）中 houmo-examples_<release>/houmo-examples/models 目录下。使用 MODELZOO_PATH 环境变量表示ModelZoo所在路径。

ModelZoo模型库仅部分模型示例支持在后摩M50系列产品上运行，下面目录结构仅展示支持的模型示例：

|-- models    # ModelZoo网络模型示例，包括各网络模型编译、推理、性能评估的运行脚本等。
|   |-- asr                      # 自动语音识别相关网络模型
|   |   |-- glm-asr              # 中文场景专用通用语音识别模型
|   |   |-- qwen3-asr            # 通用语音识别模型
|   |   |-- sensevoice           # 语音识别、情感识别和语音事件检测模型
|   |   |-- ct_transformer       # 语音文本后处理模型
|   |   |-- cam                  # CAM++语言识别模型
|   |   `-- whisper              # 多语种全局通用语音识别模型
|   |-- autodrive                # 自动驾驶相关网络模型
|   |   `-- yolop                # YOLOP网络模型
|   |-- backbone                 # Backbone网络模型
|   |   |-- efficientnet         # EfficientNet网络模型
|   |   |-- mobilenetv2          # MobileNetV2网络模型
|   |   |-- resnet50             # ResNet50网络模型
|   |   |-- yolov8m-cls          # YOLOv8m 的图像分类模型
|   |   |-- dinov3-base          # DINOv3系列视觉基础模型
|   |   `-- ViT-B-16             # Vision Transformer网络模型
|   |-- detection                # 检测网络模型
|   |   |-- yolov3               # YOLOv3网络模型
|   |   |-- yolov5s              # YOLOv5s网络模型（含动态裁剪功能）
|   |   |-- yolov5s_feature      # YOLOv5s网络模型（无动态裁剪功能）
|   |   |-- yolov7               # YOLOv7网络模型
|   |   |-- yolov8m              # YOLOv8m网络模型
|   |   |-- yolov9m              # YOLOv9m网络模型
|   |   |-- yolov10m             # YOLOv10m网络模型
|   |   |-- yolo11m              # YOLO11m网络模型
|   |   |-- yolo12m              # YOLO12m网络模型
|   |   |-- yolov5m_face         # YOLOv5m人脸检测模型
|   |   |-- yolox                # YOLOX网络模型
|   |   `-- yolo26m              # YOLO26m网络模型
|   |-- diffusion                # 扩散生成模型
|   |   `-- z-image              # 文本到图像生成扩散模型
|   |-- embedding                # 嵌入模型
|   |   |-- qwen3-embedding      # 文本向量化模型
|   |   |-- bge                  # BGE信息检索模型
|   |   `-- gte                  # GTE信息检索模型
|   |-- estimation               # 实时人体姿态估计相关网络模型
|   |   `-- yolov8m-pose         # 评估网络模型
|   |-- llm                      # 大语言模型
|   |   |-- CoPaw-Flash          # 端侧智能体小模型
|   |   |-- deepseek-r1-qwen3-8b # DeepSeek-R1-0528-Qwen3-8B模型
|   |   |-- gpt-oss              # GPT-OSS 模型
|   |   |-- qwen2.5              # Qwen2.5-7B模型
|   |   |-- qwen3                # Qwen3模型，包括0.6B、1.7B、4B、8B和14B
|   |   |-- qwen3-30b-a3b        # Qwen3-30B-a3B模型
|   |   |-- qwen3-next           # Qwen3高稀疏MoE基础大语言模型
|   |   `-- qwen3.5              # Qwen3.5模型，包括0.8B、2B、4B、9B、
|   |                            # 和Qwen3.6-35B-A3B和Qwen3.6-27B模型
|   |-- ocr                      # 深度学习的图像文字识别模型（基于OCR）
|   |   |-- glm-ocr              # 文本识别模型
|   |   |-- lprnet               # 车牌识别网络模型
|   |   |-- paddleocr-vl         # 多模态文档解析模型
|   |   |-- mineru2.5            # 文档解析视觉语言大模型
|   |   `-- PPOCRv3              # PaddlePaddle开源的一套OCR模型
|   |-- omni                     # 多模态大型语言模型
|   |   |-- qwen3-omni           # Qwen3原生端到端全模态大模型
|   |   `-- minicpmo             # MiniCPMO模型
|   |-- reranker                 # 重排序模型
|   |   `-- qwen3-reranker       # 基于语义相关性的检索结果重排序模型
|   |-- segmentation             # 图像分割相关网络模型
|   |   `-- yolov8m_seg          # YOLOv8m图像分割网络模型
|   |-- tts                      # 语音合成模型
|   |   |-- qwen3-tts            # qwen3端到端大模型文本转语音模型
|   |   `-- cosyvoice3           # CosyVoice3语音合成模型
|    `-- vlm                     # 多模态和高性能大模型推理加速引擎
|   |   |-- qwen2.5-vl           # Qwen2.5多模态视觉语言模型
|   |   |-- gemma4               # Gemma4开源权重多模态大模型
|       `-- qwen3-vl             # Qwen3多模态视觉语言模型
|-- data                         # 模型和数据集
|-- hmodel                       # 量化模型配置和工具
|-- requirements.txt             # Python环境依赖
`-- env.sh                       # ModelZoo环境变量配置脚本