通用图像生成器MCP服务器是一个支持多供应商的AI图像生成服务器,供MCP客户端使用。借助该服务器,你可以通过任何与MCP兼容的应用程序,利用谷歌(Imagen & Gemini)、智谱AI的CogView - 4或阿里巴巴的百炼模型来生成高质量的图像。
无需手动安装!服务器将自动下载并运行。
选择一个供应商并获取API密钥:
将以下内容添加到你的MCP客户端配置文件(例如claude_desktop_config.json)中:
{
"mcpServers": {
"universal-image-generator": {
"command": "uvx",
"args": [
"universal-image-generator-mcp"
],
"env": {
"IMAGE_PROVIDER": "google",
"GOOGLE_MODEL": "gemini",
"ZHIPU_API_KEY": "your-api-key-here",
"GEMINI_API_KEY": "your-api-key-here",
"DASHSCOPE_API_KEY": "your-api-key-here",
"OUTPUT_IMAGE_PATH": "/path/to/save/images"
}
}
}
}
环境变量说明:
IMAGE_PROVIDER:可以是"google"、"zhipuai"或"bailian"GOOGLE_MODEL:可以是"gemini"或"imagen"(仅适用于谷歌供应商,默认为"gemini")OUTPUT_IMAGE_PATH:保存生成图像的目录(可选)见上述快速开始部分。
配置完成后,你可以向你的AI助手提出以下请求:
生成的图像将保存到你配置的输出目录中。
generate_image_from_text根据文本描述创建图像。
generate_image_from_text(prompt: str, model_type: Optional[str] = None) -> str
参数:
prompt:要生成图像的文本描述。model_type:谷歌供应商的可选模型选择("gemini"或"imagen")
GOOGLE_MODEL环境变量(默认为"gemini")。transform_image_from_encoded (仅谷歌和百炼支持)使用Base64编码的图像数据转换图像。
transform_image_from_encoded(encoded_image: str, prompt: str) -> str
transform_image_from_file (仅谷歌和百炼支持)转换现有的图像文件。
transform_image_from_file(image_file_path: str, prompt: str) -> str
提示词:"创建一个戴着礼帽、长着翅膀的猪在充满绿色植物的未来科幻城市上空飞行的3D渲染图像"
转换提示:"添加一只可爱的小鲸鱼和猪一起飞行"
| 供应商 | 模型 | 图像生成 | 图像转换 | 语言优化 |
|---|---|---|---|---|
| 谷歌 | Imagen, Gemini | ✅ | ✅ (仅Gemini) | 英文提示词 |
| 智谱AI | CogView - 4 | ✅ | ❌ | 中文提示词 |
| 百炼 | 万相2.1 | ✅ | ✅ | 中文提示词 |
注意:对于谷歌供应商,图像转换仅支持Gemini模型,Imagen仅用于图像生成。
git clone https://github.com/ECNU3D/universal-image-generator-mcp.git
cd universal-image-generator-mcp
fastmcp dev src/universal_image_generator_mcp/server.py
访问 http://localhost:5173/ 使用MCP检查器进行测试。
本项目采用MIT许可证。