Qwen3-Reranker-0.6B 是阿里巴巴推出的轻量化中文重排序模型,专为中文文本相关性排序设计:
- 轻量级:仅0.6B参数,适合本地部署
- 高性能:能够准确评估查询与文档的相关性
- 中文优化:针对中文文本进行了特别优化
# 进入后端目录
cd backend
# 安装重排序模型依赖
uv add sentence-transformers torch系统支持自动检测和下载模型。当FastAPI服务器启动时:
- 自动检查配置的模型路径是否存在
- 如果不存在,自动从
ModelScope下载模型到指定路径 - 下载完成后在第一次使用时自动加载
无需手动下载,系统会在服务器启动时自动完成检查和下载。
如果需要手动下载:
- 访问模型页面:千问3-Reranker-0.6B · 模型库
- 下载完整模型文件到本地目录,推荐路径:
D:\Hugging_Face\models\Qwen3-Reranker-0.6B
在 .env 文件中配置模型路径:
# 重排序模型配置(可选)
RERANKER_MODEL_PATH=D:\Hugging_Face\models\Qwen3-Reranker-0.6B- CPU模式:任意现代CPU
- GPU模式:支持CUDA的NVIDIA GPU(推荐,大幅提升性能)
- Python 3.8+
- PyTorch 2.0+
- sentence_transformers 2.2.0+
- GPU加速:确保安装了CUDA版本的PyTorch以获得最佳性能
- 批量处理:虽然当前设置
batch_size=1避免padding错误,但在文档数量较少时可以尝试增加批次大小 - 模型缓存:模型会在服务启动时加载一次,后续请求无需重新加载
- 模型版本:Qwen3-Reranker-0.6B
- sentence-transformers:2.2.0+
- PyTorch:2.0+