通义万相 MCP 服务器基于 TypeScript 构建,遵循 Model Context Protocol (MCP) 规范。它为阿里云通义万相的文生图(Text-to-Image)和文生视频(Text-to-Video)能力提供支持,允许大语言模型(LLM)通过 MCP 协议直接调用图像和视频生成 API。
通义万相 MCP 服务器是一个强大的工具,它允许大语言模型(LLM)通过 MCP 协议直接调用阿里云通义万相的图像和视频生成 API。下面以百炼平台为例,展示如何快速集成该服务器:
{
"mcpServers": {
"tongyi-wanxiang": {
"command": "npx",
"args": [
"-y",
"tongyi-wanx-mcp-server@latest"
],
"env": {
"DASHSCOPE_API_KEY": "<你的通义万相 API 访问密钥>"
}
}
}
}
npm install
npm run build
npm start
以百炼平台为例,在配置文件中集成通义万相 MCP 服务器:
{
"mcpServers": {
"tongyi-wanxiang": {
"command": "npx",
"args": [
"-y",
"tongyi-wanx-mcp-server@latest"
],
"env": {
"DASHSCOPE_API_KEY": "<你的通义万相 API 访问密钥>"
}
}
}
}
prompt:图像描述的文本。width:图像宽度,默认为 512。height:图像高度,默认为 512。negative_prompt(可选):减少生成图像中出现的内容。{
"task_id": string // 任务唯一标识符
}
task_id:文生图生成时返回的任务 ID。{
"status": "completed" || "processing" || "failed",
"result_url": string, // 图像 URL,仅在完成时返回
"error_message": string // 错误信息,失败时返回
}
prompt:视频描述的文本。width:视频宽度,默认为 512。height:视频高度,默认为 512。duration(可选):视频时长,默认为 10 秒。negative_prompt(可选):减少生成视频中出现的内容。{
"task_id": string // 任务唯一标识符
}
task_id:文生视频生成时返回的任务 ID。{
"status": "completed" || "processing" || "failed",
"result_url": string, // 视频 URL,仅在完成时返回
"error_message": string // 错误信息,失败时返回
}
// config.ts
export const CONFIG = {
// 图像生成相关配置
IMAGE_GENERATION: {
pollingInterval: 1000, // 轮询间隔时间,默认为 1 秒
maxRetries: 5, // 最大重试次数,默认为 5 次
timeout: 30000 // 任务超时时间,默认为 30 秒
},
// 视频生成相关配置
VIDEO_GENERATION: {
pollingInterval: 2000, // 轮询间隔时间,默认为 2 秒
maxRetries: 10, // 最大重试次数,默认为 10 次
timeout: 600000 // 任务超时时间,默认为 10 分钟
}
};
本服务器基于 TypeScript 开发,遵循 Model Context Protocol (MCP) 规范。通过异步轮询机制处理长时间运行的图像和视频生成任务,确保任务的高效执行。同时,服务器支持与支持 MCP 的大语言模型(LLM)无缝协作,为用户提供便捷的图像和视频生成服务。
文档中未提及许可证相关信息,故跳过此章节。
error_message 以获取更多信息,并采取相应措施。