Playwright Agent

Playwright Agent

浏览器官方认证 TypeScript

🚀 AgentKit 浏览器自动化框架

AgentKit 浏览器自动化框架是一个基于 AgentKit 构建的高级工具，它借助多智能体系统，实现了智能网页导航与任务执行，能有效解决浏览器自动化操作中的复杂任务处理难题，为用户提供高效、智能的自动化体验。

🚀 快速开始

依赖项

Node.js（v14 或更高版本）
npm 或 yarn
OpenAI API 密钥（用于 GPT 模型）

安装

克隆仓库：

git clone https://github.com/tmahesh/playwright-agent.git
cd playwright-agent

安装依赖项：

npm install

设置环境变量：

cp .env.sample .env
# 使用 OpenAI API 密钥和其他配置编辑 .env 文件

在不同的终端运行以下命令：index.ts、playwright - mcp、inngest - cli

npx @playwright/mcp@latest --port 8931
npx tsx index.ts
npx inngest-cli@latest dev --no-discovery -u http://localhost:3000/api/inngest -v

✨ 主要特性

智能任务规划：能够将复杂任务分解为可管理步骤。
状态管理：可跟踪浏览器状态和操作结果。
错误处理：具备强大的错误处理和恢复机制。
事件系统：拥有全面的事件记录和监控功能。
灵活动作系统：具备可扩展的动作注册表以支持自定义行为。
验证框架：内置验证功能以确认任务完成情况。
内存管理：可维护操作上下文和历史记录。

📚 详细文档

概述

该项目实现了基于 AgentKit 的多智能体系统，用于浏览器自动化。不同的代理协同工作，实现以下目标：

规划并分解任务
导航网页
执行浏览器操作
验证结果

架构（待定）

该系统由四个专门化的代理组成：

规划代理
- 将任务分解为可执行步骤。
- 创建详细的执行计划。
- 确定任务完成标准。
导航代理
- 确定下一步操作。
- 管理状态转换。
- 处理动作执行。
- 提供详细日志和反馈。
浏览器代理
- 执行浏览器自动化操作。
- 与网页元素交互。
- 处理页面导航。
- 管理浏览器状态。
验证代理
- 验证任务完成情况。
- 核实结果。
- 处理错误情况。
- 提供成功/失败反馈。

🤝 贡献指南

叉叉克隆仓库。
创建功能分支。
提交更改。
推送到分支。
创建拉取请求。

0 条评论
分类：浏览器

0 关注
0 收藏，54 浏览
system 提出于 2025-10-05 02:39