本项目是一个模型上下文协议(Model Context Protocol)服务器,它提供窗口截图功能。借助该服务器,大型语言模型(LLMs)能够捕获 macOS 上特定窗口的屏幕截图,可通过窗口标题或窗口 ID 精准定位。
本服务器提供了一系列实用工具,可对 macOS 上的窗口进行操作,以下是各工具的详细介绍:
capture_window_screenshot:用于捕捉指定窗口的截图,可通过窗口标题或 ID 识别。
window_identifier(字符串,必需):要查找的窗口标题或窗口 ID。search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。format(字符串,可选):输出格式(二进制或 base64)(默认:"binary")。list_windows:列出所有可见窗口,无需参数。find_window:根据标题或所有者名称查找窗口。
title(字符串,必需):要查找的窗口标题或所有者名称。search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。send_key:向活动窗口发送键盘按键事件。
key(字符串,必需):要按下的键(例如:"a"、"return"、"space")。modifiers(字符串列表,可选):按住的修饰键列表(例如:["command", "shift"])。type_text:输入一串文本字符。
text(字符串,必需):要输入的文本。delay(浮点数,可选):按键之间的延迟时间(以秒为单位,默认:0.1)。以下是本服务器支持的各类按键:
await send_key("return")
await send_key("c", ["command"]) # Command+C (复制)
await type_text("Hello, World!")
您可以通过 pip 安装 macos_screen_mcp,具体命令如下:
pip install git+ssh://git@github.com/jhead/macos-screen-mcp.git
安装完成后,可使用以下命令将其作为脚本运行:
python -m macos_screen_mcp
您需要在 Claude 或 Cursor 设置中添加如下配置:
"mcpServers": {
"macos-screen": {
"name": "macos-screen",
"url": "http://localhost:8000/sse",
"description": "MCP 服务器用于捕获窗口截图",
"version": "1.0.0"
}
}
您可以使用 MCP 检查器来调试服务器,命令如下:
npx @modelcontextprotocol/inspector python -m macos_screen_mcp
我们热烈欢迎任何形式的贡献,以帮助扩展和改进 macos - screen - mcp。无论您是想添加新功能、增强现有功能,还是改进文档,您的意见都非常宝贵。欢迎提交拉取请求!请随意提出新想法、错误修复或改进建议,让 macos - screen - mcp 变得更强大、更实用。
macos - screen - mcp 采用 MIT License 许可证。这意味着您可以自由使用、修改和分发该软件,但需遵守 MIT License 的条款和条件。如需详细信息,请参阅项目存储库中的 LICENSE 文件。