Mcp Browser Use

Mcp Browser Use

🚀 browser-use MCP服务器

AI驱动的浏览器自动化服务器,实现了用于自然语言浏览器控制的模型上下文协议(MCP)。此MCP服务器的实现基于 browser-use/web-ui 项目,核心的浏览器自动化逻辑和配置模式均借鉴自原项目。

文档

✨ 主要特性

  • 🧠 MCP集成 - 完整实现协议,用于与AI代理进行通信。
  • 🌐 浏览器自动化 - 支持页面导航、表单填写和元素交互。
  • 👁️ 视觉理解 - 支持截图分析和基于视觉的交互。
  • 🔄 状态持久化 - 在任务之间保持浏览器会话。
  • 🔌 多大语言模型支持 - 集成了OpenAI、Anthropic、Azure、DeepSeek等。

🚀 快速开始

前提条件

  • Python 3.11 或更高版本
  • uv(快速Python包安装器)
  • Chrome/Chromium浏览器

📦 安装指南

Claude桌面版

在MacOS上:~/Library/Application\ Support/Claude/claude_desktop_config.json 在Windows上:%APPDATA%/Claude/claude_desktop_config.json

"mcpServers": {
"browser-use": {
"command": "uvx",
"args": [
"mcp-server-browser-use",
],
"env": {
"OPENROUTER_API_KEY": "",
"OPENROUTER_ENDPOINT": "https://openrouter.ai/api/v1",
"OPENAI_ENDPOINT": "https://api.openai.com/v1",
"OPENAI_API_KEY": "",
"ANTHROPIC_ENDPOINT": "https://api.anthropic.com",
"ANTHROPIC_API_KEY": "",
"GOOGLE_API_KEY": "",
"AZURE_OPENAI_ENDPOINT": "",
"AZURE_OPENAI_API_KEY": "",
"DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
"DEEPSEEK_API_KEY": "",
"MISTRAL_API_KEY": "",
"MISTRAL_ENDPOINT": "https://api.mistral.ai/v1",
"OLLAMA_ENDPOINT": "http://localhost:11434",
"ANONYMIZED_TELEMETRY": "true",
"BROWSER_USE_LOGGING_LEVEL": "info",
"CHROME_PATH": "",
"CHROME_USER_DATA": "",
"CHROME_DEBUGGING_PORT": "9222",
"CHROME_DEBUGGING_HOST": "localhost",
"CHROME_PERSISTENT_SESSION": "false",
"BROWSER_HEADLESS": "false",
"BROWSER_DISABLE_SECURITY": "false",
"BROWSER_WINDOW_WIDTH": "1280",
"BROWSER_WINDOW_HEIGHT": "720",
"BROWSER_TRACE_PATH": "trace.json",
"BROWSER_RECORDING_PATH": "recording.mp4",
"RESOLUTION": "1920x1080x24",
"RESOLUTION_WIDTH": "1920",
"RESOLUTION_HEIGHT": "1080",
"VNC_PASSWORD": "youvncpassword",
"MCP_MODEL_PROVIDER": "anthropic",
"MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
"MCP_TEMPERATURE": "0.3",
"MCP_MAX_STEPS": "30",
"MCP_USE_VISION": "true",
"MCP_MAX_ACTIONS_PER_STEP": "5",
"MCP_TOOL_CALL_IN_CONTENT": "true"
}
}

本地开发

"browser-use": {
"command": "uv",
"args": [
"--directory",
"/path/to/mcp-browser-use",
"run",
"mcp-server-browser-use"
],
"env": {
...
}
}

📚 详细文档

开发

# 安装开发依赖
uv sync

# 使用调试器运行
npx @modelcontextprotocol/inspector uv --directory . run mcp-server-browser-use

故障排除

  • 浏览器冲突:启动前关闭所有Chrome实例。
  • API错误:验证环境变量中的API密钥是否与你的大语言模型提供商匹配。
  • 视觉支持:确保 MCP_USE_VISION=true 以进行截图分析。

提供商配置

服务器通过环境变量支持多个大语言模型提供商。以下是 MCP_MODEL_PROVIDER 的可用选项:

提供商 必需的环境变量
Anthropic anthropic ANTHROPIC_API_KEY
ANTHROPIC_ENDPOINT(可选)
OpenAI openai OPENAI_API_KEY
OPENAI_ENDPOINT(可选)
Azure OpenAI azure_openai AZURE_OPENAI_API_KEY
AZURE_OPENAI_ENDPOINT
DeepSeek deepseek DEEPSEEK_API_KEY
DEEPSEEK_ENDPOINT(可选)
Gemini gemini GOOGLE_API_KEY
Mistral mistral MISTRAL_API_KEY
MISTRAL_ENDPOINT(可选)
Ollama ollama OLLAMA_ENDPOINT(可选,默认为localhost:11434)
OpenRouter openrouter OPENROUTER_API_KEY
OPENROUTER_ENDPOINT(可选)

注意事项:

  • 对于标记为可选的端点,如果未指定,将使用默认值。
  • 可以使用 MCP_TEMPERATURE 配置温度(默认值:0.3)。
  • 可以使用 MCP_MODEL_NAME 指定模型。
  • 对于Ollama模型,可以配置 num_ctxnum_predict 等额外的上下文设置。

致谢

本项目基于 browser-use/web-ui 项目进行扩展,遵循MIT许可证。特别感谢原作者提供的浏览器自动化框架。

📄 许可证

本项目采用MIT许可证,详情请参阅 LICENSE。

  • 0 关注
  • 0 收藏,27 浏览
  • system 提出于 2025-10-04 20:57

相似服务问题

相关AI产品