本项目是一个 MCP 服务器,它提供基于 Stable Diffusion WebUI API(ForgeUI/AUTOMATIC-1111)的文字转图像生成功能,能帮助用户轻松实现文字到图像的转换。
本服务器可提供基于 Stable Diffusion WebUI API 的文字转图像生成功能。在使用前,请确保满足以下先决条件,并完成相应的设置。
--api 标志git clone https://github.com/Ichigo3766/image-gen-mcp.git
cd image-gen-mcp
npm install
npm run build
{
"mcpServers": {
"image-gen": {
"command": "node",
"args": [
"/path/to/image-gen-mcp/build/index.js"
],
"env": {
"NODE_ENV": "production",
"PORT": "3000",
"SD_WEBUI_URL": "http://localhost:7860",
"AUTH_ENABLED": "false",
"OUTPUT_DIR": "/path/to/output",
"UPSCALER_1": "RealESRGAN_x2plus",
"UPSCALER_2": "RealSR_x4plus"
}
}
}
}
使用文字转图像模型生成高质量图像。
获取当前可用的 Stable Diffusion 模型列表。
设置默认的 Stable Diffusion 模型。
使用 Stable Diffusion 对图像进行分辨率提升。
prompt (必填):图像描述的文字提示。negative_prompt:不希望出现的内容提示。width (可选,默认 512):输出图像的宽度。height (可选,默认 512):输出图像的高度。samples (可选,默认 1):生成图像的数量。num_inference_steps (可选,默认 20):推理步骤数量。无参数,返回所有可用模型的列表。
model_id (必填):要设置的模型 ID。images (必填):需要上调的图像文件路径数组。resize_mode (可选,默认来自环境变量):0 表示倍数模式,1 表示维度模式。upscaling_resize (可选,默认来自环境变量):倍数模式下的缩放比例。upscaling_resize_w (可选,默认来自环境变量):维度模式下的目标宽度(以像素为单位)。upscaling_resize_h (可选,默认来自环境变量):维度模式下的目标高度(以像素为单位)。upscaler_1 (可选,默认来自环境变量):主上调器模型。upscaler_2 (可选,默认来自环境变量):辅助上调器模型。output_path (可选,默认当前目录):上调后图像的输出路径。使用自动重建进行开发:
npm run watch
常见问题及解决方案:
--api 标志。此 MCP 服务器根据 MIT License 分发。这意味着您可以自由地使用、修改和分发软件,但需遵守 MIT License 的条款和条件。有关详细信息,请参阅项目存储库中的 LICENSE 文件。