MCP 视频识别服务器基于 Model Context Protocol (MCP) 构建,借助 Google 的 Gemini AI,为用户提供图像、音频和视频识别工具,高效解决各类多媒体内容的识别需求。
MCP 视频识别服务器是一款强大的多媒体识别工具,下面为你介绍使用前的相关准备和操作步骤。
git clone https://github.com/yourusername/mcp-video-recognition.git
cd mcp-video-recognition
npm install
npm run build
若要通过配置文件与 Cline 或其他 MCP 客户端集成,可按以下步骤操作:
mcpServers 对象中:{
"mcpServers": {
"video-recognition": {
"command": "node",
"args": [
"/path/to/mcp-video-recognition/dist/index.js"
],
"disabled": false,
"autoApprove": []
}
}
}
/path/to/mcp-video-recognition/dist/index.js 替换为项目目录中 index.js 文件的实际路径。在 Windows 上使用正斜杠 (/) 或双反斜杠 (\)。使用以下环境变量对服务器进行配置:
GOOGLE_API_KEY:Google Gemini API 密钥TRANSPORT_TYPE:传输类型(例如:http、grpc)PORT:服务器端口npm start
{
"tool": "image_recognition",
"params": {
"input_path": "path/to/image.jpg"
}
}
{
"tool": "audio_recognition",
// 此处原文档未完整,假设后续内容如下(仅为示例完整格式)
"params": {
"input_path": "path/to/audio.wav"
}
}