这是一个用于网页浏览器自动化操作的MCP(Middleware Communication Protocol)服务器。它支持网页截图、HTML获取、JavaScript执行以及控制台日志获取等多种功能,还能通过命令进行多步骤操作,极大提升了网页自动化操作的效率和灵活性。
本服务器可用于网页浏览器自动化操作,支持多种强大功能。你可以按照以下步骤进行安装和使用。
url:必填项,目标网页的URL。full:可选项,默认为false,若设置为true则捕获完整页面截图。steps:可选项,以逗号分隔的操作步骤或指令。url:必填项,目标网页的URL。steps:可选项,以逗号分隔的操作步骤或指令。url:必填项,目标网页的URL。script:必填项,需要执行的JavaScript代码。steps:可选项,以逗号分隔的操作步骤或指令。url:必填项,目标网页的URL。steps:可选项,以逗号分隔的操作步骤或指令。sudo apt-get install xvfb
conda create -n browser-use python=3.8
conda activate browser-use
git clone https://github.com/browser-use/server.git
cd server
npm install
npm run build
{
"browser-use": {
"llm-providers": [
"glhf", // 使用 deepseek-ai/DeepSeek-V3 模型
"ollama", // 使用 qwen2.5:32b-instruct-q4_K_M 模型,上下文长度为32k
"groq", // 使用 deepseek-r1-distill-llama-70b 模型
"openai", // 使用 gpt-4o-mini 模型
"openrouter", // 使用 deepseek/deepseek-chat 模型
"github", // 使用 gpt-4o-mini 模型
"deepseek", // 使用 deepseek-chat 模型
"gemini" // 使用 gemini-2.0-flash-exp 模型
],
"vision-support": false, // 默认禁用视觉功能,启用可提升性能;设置为 true 开启视觉支持
"use-xvfb": true // 自动检测并使用 Xvfb 运行环境变量 RUNNING_UNDER_XVFB
}
}
glhf:使用 deepseek-ai/DeepSeek-V3 模型ollama:使用 qwen2.5:32b-instruct-q4_K_M 模型,上下文长度为32kgroq:使用 deepseek-r1-distill-llama-70b 模型openai:使用 gpt-4o-mini 模型openrouter:使用 deepseek/deepseek-chat 模型github:使用 gpt-4o-mini 模型deepseek:使用 deepseek-chat 模型gemini:使用 gemini-2.0-flash-exp 模型npm start
将页面上的文字颜色改为红色:
browser.use.steps(
"打开浏览器",
"访问网址 http://example.com",
"找到所有段落元素并设置颜色为红色"
)
npm run debug
服务器会在控制台输出详细的错误信息,便于排查问题。
MIT License