ImageRetrieval

This project is an image retrieval system based on DINOv2 and CLIP models. It uses Chroma vector database to support both text-to-image and image-to-image retrieval.

Generate Convert Improve

Install / Use

/learn @zheng0116/ImageRetrieval

About this skill

Quality Score

0/100

README

ImageRetrieval

<strong>English | 中文</strong>

🌟 概述

本项目是一个基于DINOv2和多模态模型（CLIP/SigLIP2/MobileCLIP2）的图像检索系统，使用Chroma向量数据库，支持文本到图像、图像到图像和图文混合检索。

将来计划

[x] 支持向量数据库
[ ] 支持从oss导入图片(minio,s3)
[x] 支持多模态智能检索
[ ] 使用rust实现
[ ] 支持不同模型提取图像特征和文本特征
[ ] 支持rpc协议

🚀 特征

使用DINOv2模型进行图像特征提取和以图搜图
支持 CLIP / SigLIP2 / MobileCLIP2 文本到图像检索
支持不同大小的DINOv2模型（小型、基础型、大型、巨型）
基于余弦相似度的图像检索
支持图文混合加权检索（multimodal retrieve）
支持后台图片元数据管理（标题/描述/标签）
支持自动标签建议（MANAGEMENT_MODEL=multimodal_tags）
使用FastAPI构建的Web界面
使用向量图像数据库检索图片

用户界面

DINOv2图像检索系统界面

安装

克隆仓库:

git clone https://github.com/zheng0116/ImageRetrieval.git
cd ImageRetrieval

安装依赖项:

sh run.sh install

配置环境变量: 在根目录创建 .env 文件，内容如下：

SERVER_URL="0.0.0.0"
SERVER_PORT=5999
MODEL_PATH="./Dinov2_model/dinov2-small" #如果你下载了权重可以自定义路径
MODEL_SIZE="small" #权重规格设置
DATABASE_FOLDER="./quary"
EMBED_MODEL="siglip2_base" # 可选: dinov2,clip,siglip2_base,mobileclip2_s0
MANAGEMENT_MODEL="none" # 可选: none,multimodal_tags

使用方法

准备您的图像数据库，将图片放置在quary文件夹中（或在.env中指定自定义文件夹）。
运行应用程序:

sh run.sh start

如果无法访问huggingface下载模型，可使用以下代理，或者使用xget代理。

 export HF_ENDPOINT=https://hf-mirror.com

打开浏览器访问 http://localhost:5999。
检索方式：
- 以图搜图：上传图片并点击"开始检索"
- 以文搜图：在文本框中输入描述并点击"文本搜索"

配置

您可以在.env文件中配置以下参数:

SERVER_URL: 服务器IP地址（默认："0.0.0.0"）
SERVER_PORT: 服务器端口号（默认：5999）
MODEL_PATH: DINOv2模型的路径（默认："./Dinov2_model/dinov2-small"）
MODEL_SIZE: DINOv2模型的大小（可选：small, base, large, giant；默认：small）
DATABASE_FOLDER: 图像数据库文件夹的路径（默认："./quary"）
EMBED_MODEL: 检索模型选择（可选：dinov2、clip、siglip2_base、mobileclip2_s0；默认：siglip2_base）
MANAGEMENT_MODEL: 后台管理策略（可选：none、multimodal_tags；默认：none）

后台管理与多模态接口

POST /multimodal_retrieve：图文混合检索（form-data，支持 text_query、file、text_weight、image_weight、tags）
GET /admin/images：分页查看图片元数据（支持 query/tags/page/page_size）
GET /admin/images/{image_name}/metadata：查看单图元数据
PATCH /admin/images/{image_name}/metadata：更新标题/描述/标签/extra
POST /admin/images/{image_name}/suggest_tags：生成标签建议
POST /admin/sync：同步磁盘图片、向量索引与元数据