🚀 AgentKit 浏览器自动化框架
AgentKit 浏览器自动化框架是一个基于 AgentKit 构建的高级工具,它借助多智能体系统,实现了智能网页导航与任务执行,能有效解决浏览器自动化操作中的复杂任务处理难题,为用户提供高效、智能的自动化体验。
🚀 快速开始
依赖项
- Node.js(v14 或更高版本)
- npm 或 yarn
- OpenAI API 密钥(用于 GPT 模型)
安装
- 克隆仓库:
git clone https://github.com/tmahesh/playwright-agent.git
cd playwright-agent
- 安装依赖项:
npm install
- 设置环境变量:
cp .env.sample .env
- 在不同的终端运行以下命令:index.ts、playwright - mcp、inngest - cli
npx @playwright/mcp@latest --port 8931
npx tsx index.ts
npx inngest-cli@latest dev --no-discovery -u http://localhost:3000/api/inngest -v
✨ 主要特性
- 智能任务规划:能够将复杂任务分解为可管理步骤。
- 状态管理:可跟踪浏览器状态和操作结果。
- 错误处理:具备强大的错误处理和恢复机制。
- 事件系统:拥有全面的事件记录和监控功能。
- 灵活动作系统:具备可扩展的动作注册表以支持自定义行为。
- 验证框架:内置验证功能以确认任务完成情况。
- 内存管理:可维护操作上下文和历史记录。
📚 详细文档
概述
该项目实现了基于 AgentKit 的多智能体系统,用于浏览器自动化。不同的代理协同工作,实现以下目标:
- 规划并分解任务
- 导航网页
- 执行浏览器操作
- 验证结果
架构(待定)
该系统由四个专门化的代理组成:
- 规划代理
- 将任务分解为可执行步骤。
- 创建详细的执行计划。
- 确定任务完成标准。
- 导航代理
- 确定下一步操作。
- 管理状态转换。
- 处理动作执行。
- 提供详细日志和反馈。
- 浏览器代理
- 执行浏览器自动化操作。
- 与网页元素交互。
- 处理页面导航。
- 管理浏览器状态。
- 验证代理
- 验证任务完成情况。
- 核实结果。
- 处理错误情况。
- 提供成功/失败反馈。
🤝 贡献指南
- 叉叉克隆仓库。
- 创建功能分支。
- 提交更改。
- 推送到分支。
- 创建拉取请求。