ModelScope 模型下载配置

模型介绍

Qwen3-Reranker-0.6B 是阿里巴巴推出的轻量化中文重排序模型，专为中文文本相关性排序设计：

轻量级：仅0.6B参数，适合本地部署
高性能：能够准确评估查询与文档的相关性
中文优化：针对中文文本进行了特别优化

安装步骤

1. 安装依赖包

# 进入后端目录
cd backend

# 安装重排序模型依赖
uv add sentence-transformers torch

2. 模型获取方式

方法一：自动下载（推荐）

系统支持自动检测和下载模型。当FastAPI服务器启动时：

自动检查配置的模型路径是否存在
如果不存在，自动从ModelScope下载模型到指定路径
下载完成后在第一次使用时自动加载

无需手动下载，系统会在服务器启动时自动完成检查和下载。

方法二：手动从Hugging Face下载

如果需要手动下载：

访问模型页面：千问3-Reranker-0.6B · 模型库
下载完整模型文件到本地目录，推荐路径：
```
D:\Hugging_Face\models\Qwen3-Reranker-0.6B
```

环境变量配置

在 .env 文件中配置模型路径：

# 重排序模型配置（可选）
RERANKER_MODEL_PATH=D:\Hugging_Face\models\Qwen3-Reranker-0.6B

硬件要求

CPU模式：任意现代CPU
GPU模式：支持CUDA的NVIDIA GPU（推荐，大幅提升性能）

软件要求

Python 3.8+
PyTorch 2.0+
sentence_transformers 2.2.0+

性能优化建议

GPU加速：确保安装了CUDA版本的PyTorch以获得最佳性能
批量处理：虽然当前设置 batch_size=1 避免padding错误，但在文档数量较少时可以尝试增加批次大小
模型缓存：模型会在服务启动时加载一次，后续请求无需重新加载

版本信息

模型版本：Qwen3-Reranker-0.6B
sentence-transformers：2.2.0+
PyTorch：2.0+

← 返回首页

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ModelScope 模型下载配置

模型介绍

安装步骤

1. 安装依赖包

2. 模型获取方式

方法一：自动下载（推荐）

方法二：手动从Hugging Face下载

环境变量配置

硬件要求

软件要求

性能优化建议

版本信息

FilesExpand file tree

modelscope_model.md

Latest commit

History

modelscope_model.md

File metadata and controls

ModelScope 模型下载配置

模型介绍

安装步骤

1. 安装依赖包

2. 模型获取方式

方法一：自动下载（推荐）

方法二：手动从Hugging Face下载

环境变量配置

硬件要求

软件要求

性能优化建议

版本信息