Siliconflow2cow
Siliconflow2cow 是一个强大的 chatgpt-on-wechat 插件,允许用户通过简单的命令生成各种风格的图像。该插件支持多种模型,包括文本到图像和图像到图像的转换,为用户提供了丰富的图像生成选项。
Install / Use
/learn @lemodragon/Siliconflow2cowREADME
Siliconflow2cow 插件(用于 chatgpt-on-wechat)
概述
Siliconflow2cow 是一款强大的 chatgpt-on-wechat 插件,让用户能够通过简单的命令生成各种风格的图像。这个多功能插件支持多种模型,可进行文本到图像和图像到图像的转换,为用户提供丰富的图像生成选项。
主要特性
- 支持多种图像生成模型(flux.d, flux.s, sd3, sdxl, sd2, sdt, sdxlt, sdxll)
- 可自定义图像尺寸和比例
- 支持文生图和图生图功能
- 自动优化用户输入的提示词
- 定期自动清理旧图片
- 支持手动清理所有生成的图片
安装步骤
- 确保您已安装 chatgpt-on-wechat。
- 将
siliconflow2cow目录复制到 chatgpt-on-wechat 的plugins文件夹中。 - 安装所需依赖:
pip install -r siliconflow2cow/requirements.txt - 在
config.json文件中配置您的 API 令牌和其他设置。
配置说明
在 config.json 文件中添加以下配置:
{
"auth_token": "sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
"enhancer_auth_token": "",
"chat_api_url": "",
"chat_model": "",
"enhancer_prompt": "",
"drawing_prefixes": ["绘", "draw"],
"image_output_dir": "./plugins/siliconflow2cow/images",
"clean_interval": 3,
"clean_check_interval": 3600
}
auth_token: 您的硅基流动 API 认证令牌enhancer_auth_token:用于自定义提示词增强API的认证令牌。留空则使用auth_token非必填chat_api_url:用于自定义提示词增强的API URL "https://api.openai.com/v1/chat/completions"。 留空则为默认 "https://api.siliconflow.cn/v1/chat/completions"。 非必填chat_model:用于自定义提示词增强的模型。默认为 "deepseek-ai/DeepSeek-V2-Chat" 非必填enhancer_prompt:用于自定义提示词增强的系统提示,留空走默认 非必填drawing_prefixes: 触发绘图的命令前缀image_output_dir: 生成图片的保存路径clean_interval: 自动清理(默认3天)前的旧图片clean_check_interval: 默认每小时检测一次图片是否需要清理(单位为s)
翻译模型选择
默认情况下,插件使用 DeepSeek 付费模型。您可以切换到免费模型,如:
Qwen/Qwen2-7B-Instruct (32K, 免费)
Qwen/Qwen2-1.5B-Instruct (32K, 免费)
Qwen/Qwen1.5-7B-Chat (32K, 免费)
THUDM/glm-4-9b-chat (32K, 免费)
THUDM/chatglm3-6b (32K, 免费)
01-ai/Yi-1.5-9B-Chat-16K (16K, 免费)
01-ai/Yi-1.5-6B-Chat (4K, 免费)
internlm/internlm2_5-7b-chat (32K, 免费)
国际领先模型部分:
google/gemma-2-9b-it (8K, 免费)
meta-llama/Meta-Llama-3-8B-Instruct (8K, 免费)
meta-llama/Meta-Llama-3.1-8B-Instruct (8K, 免费)
mistralai/Mistral-7B-Instruct-v0.2 (32K,免费)
优化建议
为提高图像质量,特别是解决颜色过度饱和的问题,可以考虑调整以下参数:
-
推理步数 (
num_inference_steps):- 标准模型:20-50 步
- 快速模型(如 SDXL Turbo):4-10 步
-
引导尺度 (
guidance_scale):- 标准范围:5.0-8.0
- 对于过度饱和的情况,尝试:3.0-5.0
-
提示词优化:
- 使用具体、详细的描述
- 包含艺术风格(例如,"油画风格")
- 使用括号增加权重:"(蓝色眼睛:1.2)"
-
模型特定配置: 根据您使用的模型(FLUX、SD、SDXL Turbo 等)调整参数
使用方法
使用以下格式生成图像:
[前缀] [提示词] -m [模型] ---[宽高比]
示例:
绘RPG角色绘画风格。年轻的人类女性,有着清晰可见的骆驼耳朵,高高地举在头上。她有蓝色的眼睛。粉红色的头发扎成两条辫子。她脖子上戴着一个旧的奖章,上面画着一朵花。她的头上戴着一个简单的花冠。她穿着一件带有花卉图案的浅色波西米亚风格长裙-m flux.d ---16:9
输入格式错误时(模型不存在、尺寸不存在时...),会使用默认模型flux.s默认尺寸1024x1024请求接口 <img width="1076" alt="image" src="https://github.com/user-attachments/assets/da661e24-8db1-4fdc-b24a-ce945a08b2c3">
支持的模型
- flux.d: FLUX.1-dev
- flux.s: FLUX.1-schnell
- sd3: Stable Diffusion 3 Medium
- sdxl: Stable Diffusion XL Base 1.0
- sd2: Stable Diffusion 2.1
- sdt: Stable Diffusion Turbo
- sdxlt: Stable Diffusion XL Turbo
- sdxll: SDXL-Lightning
可用宽高比
- 1:1 (1024x1024)
- 1:2 (1024x2048)
- 2:1 (2048x1024)
- 3:2 (1536x1024)
- 2:3 (1024x1536)
- 4:3 (1536x1152)
- 3:4 (1152x1536)
- 16:9 (2048x1152)
- 9:16 (1152x2048)
图像到图像转换
在提示词中包含图片 URL:
绘 将这张图片中的猫娘头上加上玫瑰 https://demo-cloudflare-imgbed.pages.dev/file/3a58a0d70ecf5439ec784.png -m sdxl ---9:16
<img width="1077" alt="image" src="https://github.com/user-attachments/assets/a8921a07-46ef-4aae-85a8-782c1d8fb497">
- 图生图有点奇葩,勉勉强强使用吧(第一张为原图,第二张为图生图)
重要说明
-
确保您有足够的 API 使用额度。
-
请确保您有足够的存储空间来保存生成的图片。
-
插件会自动优化您的提示词以产生更好的结果。
-
请遵守API提供商的使用条款和内容政策。(出现451ERROR为检测到违规提示词,sd2较易触发)
<img width="1072" alt="image" src="https://github.com/user-attachments/assets/e0c85d94-5332-41d9-a337-2f015bbfa163"> -
定期清理功能会自动删除指定天数前的图片,请注意备份重要图片。
-
使用
绘clean_all命令时要小心,它会删除所有已生成的图片。
故障排除
如果遇到问题:
- 验证您的 API 令牌是否正确。
- 确保您有稳定的网络连接。
- 查看日志文件以获取详细的错误信息。
贡献
特别感谢 L 站的"逆向达人"提供的见解。 Workers 部署链接
我们欢迎您提交问题和拉取请求,以改进这个插件!
