Browser Operator

Browser Operator

🚀 MCP 浏览器操作员

MCP 浏览器操作员是一款强大的服务器,主要用于浏览器自动化、借助 LLM 控制浏览器、与网页进行交互以及分析网页内容。它通过 JSON - RPC 接口实现了标准化,为用户提供了便捷、高效的操作体验。

🚀 快速开始

MCP 浏览器操作员使用起来较为简单,以下为你介绍运行服务器的方式:

# 以开发模式运行
python -m src/mcp_operator.server dev --port 3000

# 以生产模式运行
python -m src/mcp_operator.server production --port 3000

✨ 主要特性

核心功能

  1. 浏览器管理:可轻松创建、导航和关闭浏览器实例,为用户提供灵活的浏览器操作体验。
  2. 任务跟踪:能够异步执行复杂任务,例如网页互动和自动化操作,提高工作效率。
  3. 网页交互:借助 LLM 控制浏览器进行高级操作,满足多样化的网页交互需求。
  4. 工具访问:提供丰富的调试工具(如控制台日志、网络日志)和审计工具(如可访问性审计、性能审计),助力开发和优化工作。

其他功能

  • 持久化状态:通过项目名称维护独立的浏览器会话,支持多个项目,方便管理不同的工作场景。
  • 安全性:具备域名阻止、URL 验证和会话隔离等安全机制,保障用户的使用安全。

📦 安装指南

安装要求

  • Python:版本需 3.11 及以上。
  • Playwright:一款强大的浏览器自动化工具。
  • OpenAI API 密钥:在使用 LLM 控制功能时是必需的。

安装步骤

# 安装 MCP 操作员
pip install mcp-browser-operator

# 安装 Playwright
playwright install chromium firefox

💻 使用示例

可执行脚本

  • run - server:用于启动 MCP 服务器。
  • run - tests:执行单元测试和集成测试,确保系统的稳定性。
  • run - test - harness:使用 MCP 检查仪进行调试。

📚 详细文档

核心 API 方法

浏览器操作

  • 创建浏览器实例mcp__browser - operator__createBrowser
  • 导航到 URLmcp__browser - operator__navigate
  • 关闭浏览器mcp__browser - operator__closeBrowser

异步任务管理

  1. 启动任务:调用浏览器方法获取 job_id
  2. 检查进度:使用 get - job - status 直到任务完成。
  3. 处理结果:从任务状态中提取结果。

用户笔记

  • 添加笔记mcp__browser - operator__addNote

调试工具

  • 获取控制台日志mcp__browser - tools__getConsoleLogs
  • 截图mcp__browser - tools__takeScreenshot

审计工具

  • 可访问性审计mcp__browser - tools__runAccessibilityAudit
  • 性能审计mcp__browser - tools__runPerformanceAudit

🔧 技术细节

项目结构

src/mcp_operator/
├── __init__.py
├── __main__.py
├── server.py
├── browser.py
└── cua/
├── agent.py
├── computer.py
└── utils.py

开发指南

使用 MCP 检查仪

# 通过运行测试 harness 启动
./run - test - harness

# 或直接使用检查仪
npx @modelcontextprotocol/inspector ./run - server

安全措施

  • 域名阻止:防止访问恶意网站,保障系统安全。
  • URL 验证:在导航前验证 URL 的安全性,避免潜在风险。
  • 会话隔离:不同浏览器实例之间完全隔离,确保数据和操作的独立性。
  • 0 关注
  • 0 收藏,23 浏览
  • system 提出于 2025-10-04 19:51

相似服务问题

相关AI产品