本项目是一个提供文本转图像生成功能的MCP服务器,借助Stable Diffusion WebUI API(ForgeUI/AUTOMATIC-1111)实现强大的图像生成能力。
本服务器可帮助你轻松实现文本到图像的转换以及图像放大等功能。下面为你详细介绍如何使用。
--api标志git clone https://github.com/Ichigo3766/image-gen-mcp.git
cd image-gen-mcp
npm install
npm run build
{
"mcpServers": {
"image-gen": {
"command": "node",
"args": [],
"env": {
"SD_WEBUI_URL": "http://localhost:7860",
"SD_API_KEY": "your_api_key", // 可选,如果WebUI启用了API密钥
"SD_MODEL_NAME": "模型名称" // 可选,默认为WebUI中的默认模型
}
}
}
}
使用/api/generate-image端点即可轻松生成图像。请求体包含以下参数:
{
"prompt": "输入提示词",
"negative_prompt": "排除提示词", // 可选,默认为空
"width": 512,
"height": 512,
"samples": 1,
"num_inference_steps": 20,
"safety_checker": true, // 开关安全检查,防止生成不适当内容,默认启用
"enhance_prompt": true, // 启用提示词增强,默认启用
"seed": null // 随机种子,可选,默认为随机值
}
使用/api/upscale-images端点可对图像进行放大处理。请求体包含以下参数:
{
"images": ["image1.jpg", "image2.png"], // 要放大的图像文件路径数组
"resize_mode": 0, // 0表示按比例缩放,1表示固定尺寸,默认从环境变量获取
"upscaling_resize": 4, // 缩放倍率,当resize_mode=0时使用,默认从环境变量获取
"upscaling_resize_w": 1024, // 目标宽度(像素),当resize_mode=1时使用,默认从环境变量获取
"upscaling_resize_h": 1024, // 目标高度(像素),当resize_mode=1时使用,默认从环境变量获取
"upscaler_1": "RealESRGAN_x4Plus", // 主要放大器模型, 默认从环境变量获取
"upscaler_2": null, // 次级放大器模型,默认为null
"output_path": "upscaled_images" // 放大后图像的输出目录,默认为当前目录/upscaled-images
}
若你需要在开发过程中使用自动重建功能,可运行以下命令:
npm run watch
在使用过程中,若遇到问题可参考以下常见问题及解决方案:
--api标志运行此MCP服务器根据MIT License授权。这意味着你可以自由地使用、修改和分发软件,但需遵守MIT License的条款和条件。有关详细信息,请参阅项目仓库中的LICENSE文件。