画图绘制代理是一个基于Python的自动化工具,它借助Google的Gemini AI,让用户可以通过自然语言指令来控制Microsoft Paint。用户只需使用简单的英文指令,就能在MS Paint中绘制各种形状、插入文本,还能进行颜色管理,极大地提升了绘图的便捷性。
git clone [仓库地址]
cd paint-drawing-agent
pip install -r requirements.txt
.env文件,并添加您的Google API密钥:GOOGLE_API_KEY=your_api_key_here
python talk2mcp.py
git clone [仓库地址]
cd paint-drawing-agent
pip install -r requirements.txt
在项目根目录中创建一个.env文件,并添加您的Google API密钥:
GOOGLE_API_KEY=your_api_key_here
python talk2mcp.py
输入以下指令即可开始绘图:
> 在中心画一个红色的圆
> 在顶部写'Hello World'并用黑色显示
> 在坐标400,300处绘制一个蓝色矩形
> 从顶部到底部画一条绿色直线
若遇到绘制位置不准确的问题,可重新校准系统:
python enhanced_calibrate.py
paint-drawing-agent/
├── talk2mcp.py # 主应用程序文件
├── tools/ # 核心自动化工具
│ ├── __init__.py
│ └── paint_commands.py # Paint自动化命令
├── calibration_profiles/ # 存储的校准数据
├── LLM_LOGS/ # AI交互日志
├── logs/ # 应用程序日志
└── requirements.txt # 项目依赖项
系统使用校准系统来精确定位Paint界面元素。要重新校准:
python enhanced_calibrate.py
系统维护多种类型的日志:
/logs/paint_agent_[时间戳].log/LLM_LOGS/session_log.json/calibration_profiles/系统包含全面的错误处理功能,包括:
常见问题及解决方案:
未找到Paint窗口
绘制位置问题
AI通信错误
该项目利用Google的Gemini AI进行自然语言处理,将用户输入的英文指令转换为可执行的绘图操作。同时,使用PyAutoGUI进行GUI自动化,Win32GUI进行Windows交互,实现对Microsoft Paint的控制。通过位置校准系统,确保绘图位置的准确性。详细日志记录和全面的错误处理功能,方便用户排查和解决问题。
[此处放置您的许可证信息]