本项目展示了如何借助模型上下文协议(MCP)实现与遗留Windows应用程序(MSPaint)的自动化交互。它运用pywinauto对绘图应用程序进行控制,并借助fastmcp定义工具,这些工具可供AI代理调用。由Google的Gemini模型提供支持的AI代理,能够依据自然语言指令执行任务,例如在Paint画布上绘制矩形以及添加文本。
python-dotenvhttp.serverargparsepip install python-dotenv
requirements.txt中的所有依赖项安装到您的环境中。.env文件中:GEMINI_API_KEY=your_api_key_here
python mcp_server.py --port 8000
python mcp_client.py --mode automation
pip install python-dotenv
requirements.txt中的所有依赖项安装到您的环境中。.env文件中:GEMINI_API_KEY=your_api_key_here
模型上下文协议(MCP)是一个框架,使AI模型能够与外部工具和资源交互。它提供了一种标准方式,供模型调用功能、检索数据并执行现实世界中的操作。在此项目中,MCP用于将Paint自动化功能作为工具公开,这些工具可以由AI代理调用。
├── MSPaint-MCP-Server/
│ ├── mcp_server.py # 定义包含Paint自动化功能的MCP服务器
│ ├── mcp_client.py # 定义与服务器和AI模型交互的MCP客户端
│ ├── requirements.txt # 列出项目依赖项
│ └── .env # 存储Google Gemini API密钥
pywinauto库控制Paint窗口,实现图形绘制。.env文件中正确设置了Gemini API密钥。欢迎贡献!请通过提交拉取请求的方式分享您的更改。
MIT许可证