这是一个用于Chrome浏览器自动化的模型上下文协议(MCP)服务器,它通过调试协议与Chrome调试端口建立连接,支持在保持登录会话的情况下实现浏览器自动化,为需要用户认证的自动化场景提供了理想解决方案。
使用npx直接启动,无需安装:
# 1. 以调试模式启动Chrome
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222 --user-data-dir=/tmp/chrome-debug
# 2. 直接运行MCP服务器
npx chrome-debug-mcp
git clone https://github.com/rainmenxia/chrome-debug-mcp.git
cd chrome-debug-mcp
npm install
npm run build
npm start
npx chrome-debug-mcp,无需复杂安装。服务器需要连接到启用了调试端口的Chrome实例:
# macOS
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222 --user-data-dir=/tmp/chrome-debug
# Windows
chrome.exe --remote-debugging-port=9222 --user-data-dir=c:\temp\chrome-debug
# Linux
google-chrome --remote-debugging-port=9222 --user-data-dir=/tmp/chrome-debug
⚠️ 重要提示
--user-data-dir参数指向一个临时目录,确保Chrome以调试模式启动。- 启动后,您可以正常登录网站,登录会话将被保留。
- 服务器将复用此Chrome实例,无需重新登录。
在您的MCP客户端中添加以下配置:
{
"mcpServers": {
"browser-automation": {
"command": "npx",
"args": ["chrome-debug-mcp"]
}
}
}
就是这么简单! 无需安装、下载,也无需复杂的路径配置。
💡 其他安装方法
全局安装:
npm install -g chrome-debug-mcp{ "mcpServers": { "browser-automation": { "command": "chrome-debug-mcp" } } }本地项目安装:
npm install chrome-debug-mcp{ "mcpServers": { "browser-automation": { "command": "npx", "args": ["chrome-debug-mcp"] } } }
以下是一些可用工具的使用示例:
launch_browser连接到Chrome调试端口并初始化浏览器会话。
{
"name": "launch_browser",
"arguments": {
"remote_host": "http://localhost:9222" // 可选
}
}
navigate_to使用智能标签管理导航到指定URL。
{
"name": "navigate_to",
"arguments": {
"url": "https://example.com"
}
}
click在指定坐标处点击。
{
"name": "click",
"arguments": {
"coordinate": "100,200"
}
}
type_text输入文本内容。
{
"name": "type_text",
"arguments": {
"text": "Hello World"
}
}
scroll_down / scroll_up滚动页面。
{
"name": "scroll_down",
"arguments": {}
}
hover将鼠标悬停在指定位置。
{
"name": "hover",
"arguments": {
"coordinate": "100,200"
}
}
resize_browser调整浏览器窗口大小。
{
"name": "resize_browser",
"arguments": {
"size": "1200,800"
}
}
get_page_content获取当前页面的HTML内容。
{
"name": "get_page_content",
"arguments": {}
}
close_browser关闭浏览器连接。
{
"name": "close_browser",
"arguments": {}
}
# 先在Chrome中手动登录Twitter/微博
# 然后使用MCP工具进行自动化操作
launch_browser -> navigate_to -> click -> type_text
# 保持淘宝/京东的登录状态
# 自动化产品搜索、价格监控等操作
launch_browser -> navigate_to -> type_text -> click
# 从需要登录的网站抓取数据
# 绕过登录验证,直接进行操作
launch_browser -> navigate_to -> get_page_content
example.com)复用现有标签页。如果Chrome在Docker容器中运行:
# 在Docker中启动Chrome
docker run -d --name chrome-debug \
-p 9222:9222 \
--shm-size=2gb \
zenika/alpine-chrome \
--no-sandbox \
--disable-dev-shm-usage \
--remote-debugging-address=0.0.0.0 \
--remote-debugging-port=9222
服务器将自动发现Docker环境中的Chrome实例。
--remote-debugging-port=9222启动。lsof -i :9222。MCP客户端 ←→ 标准输入输出 ←→ MCP服务器 ←→ Chrome调试端口 ←→ Chrome浏览器
# 监听模式编译
npm run dev
# 查看MCP通信日志
DEBUG=mcp* npm start
# 构建项目
npm run build
# 发布到npm
npm publish
本项目采用MIT许可证。
本项目的设计理念和核心概念受到了RooCode项目的启发。RooCode是一个优秀的浏览器自动化MCP服务器实现,为我们提供了宝贵的技术参考和设计思路。
特别感谢RooCode团队在以下方面的贡献:
在此基础上,本项目进一步专注于保持登录会话的浏览器自动化,通过连接现有的Chrome调试端口来维护用户会话,实现了更实用的自动化功能。
这个MCP服务器的最大特点是能够连接到现有的Chrome实例并保持登录会话,非常适合需要用户认证的自动化场景。通过Chrome调试端口,它可以接管已登录用户的浏览器会话,实现真正的“会话持久化”浏览器自动化。