Siliconflow2cow 插件（用于 chatgpt-on-wechat）

概述

Siliconflow2cow 是一款强大的 chatgpt-on-wechat 插件，让用户能够通过简单的命令生成各种风格的图像。这个多功能插件支持多种模型，可进行文本到图像和图像到图像的转换，为用户提供丰富的图像生成选项。

主要特性

支持多种图像生成模型（flux.d, flux.s, sd3, sdxl, sd2, sdt, sdxlt, sdxll）
可自定义图像尺寸和比例
支持文生图和图生图功能
自动优化用户输入的提示词
定期自动清理旧图片
支持手动清理所有生成的图片

安装步骤

确保您已安装 chatgpt-on-wechat。
将 siliconflow2cow 目录复制到 chatgpt-on-wechat 的 plugins 文件夹中。

安装所需依赖：

pip install -r siliconflow2cow/requirements.txt

在 config.json 文件中配置您的 API 令牌和其他设置。

配置说明

在 config.json 文件中添加以下配置：

{
  "auth_token": "sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "enhancer_auth_token": "",
  "chat_api_url": "", 
  "chat_model": "",
  "enhancer_prompt": "",
  "drawing_prefixes": ["绘", "draw"],
  "image_output_dir": "./plugins/siliconflow2cow/images",
  "clean_interval": 3,
  "clean_check_interval": 3600
}

auth_token: 您的硅基流动 API 认证令牌
enhancer_auth_token：用于自定义提示词增强API的认证令牌。留空则使用 auth_token 非必填
chat_api_url：用于自定义提示词增强的API URL "https://api.openai.com/v1/chat/completions"。留空则为默认 "https://api.siliconflow.cn/v1/chat/completions"。 非必填
chat_model：用于自定义提示词增强的模型。默认为 "deepseek-ai/DeepSeek-V2-Chat" 非必填
enhancer_prompt：用于自定义提示词增强的系统提示，留空走默认 非必填
drawing_prefixes: 触发绘图的命令前缀
image_output_dir: 生成图片的保存路径
clean_interval: 自动清理（默认3天）前的旧图片
clean_check_interval: 默认每小时检测一次图片是否需要清理（单位为s）

翻译模型选择

默认情况下，插件使用 DeepSeek 付费模型。您可以切换到免费模型，如：

Qwen/Qwen2-7B-Instruct (32K, 免费)
Qwen/Qwen2-1.5B-Instruct (32K, 免费)
Qwen/Qwen1.5-7B-Chat (32K, 免费)
THUDM/glm-4-9b-chat (32K, 免费)
THUDM/chatglm3-6b (32K, 免费)
01-ai/Yi-1.5-9B-Chat-16K (16K, 免费)
01-ai/Yi-1.5-6B-Chat (4K, 免费)
internlm/internlm2_5-7b-chat (32K, 免费)
国际领先模型部分：
google/gemma-2-9b-it (8K, 免费)
meta-llama/Meta-Llama-3-8B-Instruct (8K, 免费)
meta-llama/Meta-Llama-3.1-8B-Instruct (8K, 免费)
mistralai/Mistral-7B-Instruct-v0.2 (32K，免费)

优化建议

为提高图像质量，特别是解决颜色过度饱和的问题，可以考虑调整以下参数：

推理步数 (num_inference_steps)：
- 标准模型：20-50 步
- 快速模型（如 SDXL Turbo）：4-10 步
引导尺度 (guidance_scale)：
- 标准范围：5.0-8.0
- 对于过度饱和的情况，尝试：3.0-5.0
提示词优化：
- 使用具体、详细的描述
- 包含艺术风格（例如，"油画风格"）
- 使用括号增加权重："(蓝色眼睛:1.2)"
模型特定配置：根据您使用的模型（FLUX、SD、SDXL Turbo 等）调整参数

使用方法

使用以下格式生成图像：

[前缀] [提示词] -m [模型] ---[宽高比]

示例：

绘RPG角色绘画风格。年轻的人类女性，有着清晰可见的骆驼耳朵，高高地举在头上。她有蓝色的眼睛。粉红色的头发扎成两条辫子。她脖子上戴着一个旧的奖章，上面画着一朵花。她的头上戴着一个简单的花冠。她穿着一件带有花卉图案的浅色波西米亚风格长裙-m flux.d ---16:9

输入格式错误时(模型不存在、尺寸不存在时...)，会使用默认模型flux.s默认尺寸1024x1024请求接口 <img width="1076" alt="image" src="https://github.com/user-attachments/assets/da661e24-8db1-4fdc-b24a-ce945a08b2c3">

微信图片_20240920192537

支持的模型

flux.d: FLUX.1-dev
flux.s: FLUX.1-schnell
sd3: Stable Diffusion 3 Medium
sdxl: Stable Diffusion XL Base 1.0
sd2: Stable Diffusion 2.1
sdt: Stable Diffusion Turbo
sdxlt: Stable Diffusion XL Turbo
sdxll: SDXL-Lightning

可用宽高比

1:1 (1024x1024)
1:2 (1024x2048)
2:1 (2048x1024)
3:2 (1536x1024)
2:3 (1024x1536)
4:3 (1536x1152)
3:4 (1152x1536)
16:9 (2048x1152)
9:16 (1152x2048)

图像到图像转换

在提示词中包含图片 URL：

绘 将这张图片中的猫娘头上加上玫瑰 https://demo-cloudflare-imgbed.pages.dev/file/3a58a0d70ecf5439ec784.png -m sdxl ---9:16

图生图有点奇葩，勉勉强强使用吧（第一张为原图，第二张为图生图）

重要说明

确保您有足够的 API 使用额度。
请确保您有足够的存储空间来保存生成的图片。
插件会自动优化您的提示词以产生更好的结果。
请遵守API提供商的使用条款和内容政策。(出现451ERROR为检测到违规提示词，sd2较易触发)
<img width="1072" alt="image" src="https://github.com/user-attachments/assets/e0c85d94-5332-41d9-a337-2f015bbfa163">
定期清理功能会自动删除指定天数前的图片，请注意备份重要图片。
使用 绘clean_all 命令时要小心，它会删除所有已生成的图片。

故障排除

如果遇到问题：

验证您的 API 令牌是否正确。
确保您有稳定的网络连接。
查看日志文件以获取详细的错误信息。

贡献

特别感谢 L 站的"逆向达人"提供的见解。 Workers 部署链接

我们欢迎您提交问题和拉取请求，以改进这个插件！

Siliconflow2cow

Install / Use

README