Playwright Agent

Playwright Agent

🚀 AgentKit 浏览器自动化框架

AgentKit 浏览器自动化框架是一个基于 AgentKit 构建的高级工具,它借助多智能体系统,实现了智能网页导航与任务执行,能有效解决浏览器自动化操作中的复杂任务处理难题,为用户提供高效、智能的自动化体验。

🚀 快速开始

依赖项

  • Node.js(v14 或更高版本)
  • npm 或 yarn
  • OpenAI API 密钥(用于 GPT 模型)

安装

  1. 克隆仓库:
git clone https://github.com/tmahesh/playwright-agent.git
cd playwright-agent
  1. 安装依赖项:
npm install
  1. 设置环境变量:
cp .env.sample .env
# 使用 OpenAI API 密钥和其他配置编辑 .env 文件
  1. 在不同的终端运行以下命令:index.ts、playwright - mcp、inngest - cli
npx @playwright/mcp@latest --port 8931
npx tsx index.ts
npx inngest-cli@latest dev --no-discovery -u http://localhost:3000/api/inngest -v

✨ 主要特性

  • 智能任务规划:能够将复杂任务分解为可管理步骤。
  • 状态管理:可跟踪浏览器状态和操作结果。
  • 错误处理:具备强大的错误处理和恢复机制。
  • 事件系统:拥有全面的事件记录和监控功能。
  • 灵活动作系统:具备可扩展的动作注册表以支持自定义行为。
  • 验证框架:内置验证功能以确认任务完成情况。
  • 内存管理:可维护操作上下文和历史记录。

📚 详细文档

概述

该项目实现了基于 AgentKit 的多智能体系统,用于浏览器自动化。不同的代理协同工作,实现以下目标:

  • 规划并分解任务
  • 导航网页
  • 执行浏览器操作
  • 验证结果

架构(待定)

该系统由四个专门化的代理组成:

  1. 规划代理
    • 将任务分解为可执行步骤。
    • 创建详细的执行计划。
    • 确定任务完成标准。
  2. 导航代理
    • 确定下一步操作。
    • 管理状态转换。
    • 处理动作执行。
    • 提供详细日志和反馈。
  3. 浏览器代理
    • 执行浏览器自动化操作。
    • 与网页元素交互。
    • 处理页面导航。
    • 管理浏览器状态。
  4. 验证代理
    • 验证任务完成情况。
    • 核实结果。
    • 处理错误情况。
    • 提供成功/失败反馈。

🤝 贡献指南

  1. 叉叉克隆仓库。
  2. 创建功能分支。
  3. 提交更改。
  4. 推送到分支。
  5. 创建拉取请求。
  • 0 关注
  • 0 收藏,28 浏览
  • system 提出于 2025-10-05 02:39

相似服务问题

相关AI产品