AI 视觉 MCP 服务器是一个提供人工智能驱动视觉分析功能的模型上下文协议(MCP)服务器,它支持 Claude 和其他与 MCP 兼容的人工智能助手,能为用户提供强大的视觉分析和文件操作能力。
# 克隆仓库
git clone https://github.com/samihalawa/mcp-server-ai-vision.git
cd mcp-server-ai-vision
# 安装依赖项
npm install
# 构建服务器
npm run build
npm start
将服务器添加到您的 MCP 配置中:
{
"servers": {
"ai-vision": {
"command": "/path/to/node",
"args": ["/path/to/mcp-server-ai-vision/build/index.js"],
"enabled": true,
"port": 3005,
"environment": {
"NODE_PATH": "/path/to/node_modules",
"PATH": "/usr/local/bin:/usr/bin:/bin",
"GEMINI_API_KEY": "your-gemini-api-key"
}
}
}
}
捕获网站的屏幕快照:
screenshot_url(url: "https://example.com")
分析屏幕快照:
analyze_screen()
根据分析生成报告:
generate_report(testUrl: "https://example.com", observations: {...})
url (字符串,必需):要捕获屏幕快照的 URL(例如 http://localhost:4999, https://google.com)fullPage (布尔值,可选):是否捕获整页还是仅视图端口。默认:falsewaitForSelector (字符串,可选):在捕获屏幕快照之前等待的 CSS 选择器waitTime (数字,可选):等待的时间(以毫秒为单位)。默认:1000path (字符串):文件路径startLine (数字):起始行号(1 索引)endLine (数字):结束行号(1 索引)path (字符串):文件路径startLine (数字):要替换的起始行号(1 索引)endLine (数字):要替换的结束行号(1 索引)content (字符串):要替换的新内容testUrl (字符串):要测试的应用程序的 URLappName (字符串,可选):正在分析的应用程序名称date (字符串,可选):分析日期(YYYY-MM-DD)observations (对象):按组件、数据状态、交互等结构化的观察结果本项目采用 MIT 许可证。