Macos Screen Mcp

Macos Screen Mcp

🚀 macOS 屏幕视图与控制 MCP 服务器

本项目是一个模型上下文协议(Model Context Protocol)服务器,它提供窗口截图功能。借助该服务器,大型语言模型(LLMs)能够捕获 macOS 上特定窗口的屏幕截图,可通过窗口标题或窗口 ID 精准定位。

🚀 快速开始

本服务器提供了一系列实用工具,可对 macOS 上的窗口进行操作,以下是各工具的详细介绍:

已提供的工具

  • capture_window_screenshot:用于捕捉指定窗口的截图,可通过窗口标题或 ID 识别。
    • window_identifier(字符串,必需):要查找的窗口标题或窗口 ID。
    • search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。
    • format(字符串,可选):输出格式(二进制或 base64)(默认:"binary")。
  • list_windows:列出所有可见窗口,无需参数。
  • find_window:根据标题或所有者名称查找窗口。
    • title(字符串,必需):要查找的窗口标题或所有者名称。
    • search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。
  • send_key:向活动窗口发送键盘按键事件。
    • key(字符串,必需):要按下的键(例如:"a"、"return"、"space")。
    • modifiers(字符串列表,可选):按住的修饰键列表(例如:["command", "shift"])。
  • type_text:输入一串文本字符。
    • text(字符串,必需):要输入的文本。
    • delay(浮点数,可选):按键之间的延迟时间(以秒为单位,默认:0.1)。

支持的键

以下是本服务器支持的各类按键:

  • 字母:a - z(不区分大小写)。
  • 数字:0 - 9。
  • 特殊键:return、tab、space、delete、escape。
  • 方向键:up_arrow、down_arrow、left_arrow、right_arrow。
  • 修饰键:command、shift、control、option(还包括 right_shift、right_option、right_control)。

💻 使用示例

基础用法

发送单个按键

await send_key("return")

带有修饰符的按键

await send_key("c", ["command"])  # Command+C (复制)

输入文本

await type_text("Hello, World!")

📦 安装指南

使用 pip

您可以通过 pip 安装 macos_screen_mcp,具体命令如下:

pip install git+ssh://git@github.com/jhead/macos-screen-mcp.git

安装完成后,可使用以下命令将其作为脚本运行:

python -m macos_screen_mcp

📚 详细文档

配置

设置配置

您需要在 Claude 或 Cursor 设置中添加如下配置:

"mcpServers": {
"macos-screen": {
"name": "macos-screen",
"url": "http://localhost:8000/sse",
"description": "MCP 服务器用于捕获窗口截图",
"version": "1.0.0"
}
}

调试

您可以使用 MCP 检查器来调试服务器,命令如下:

npx @modelcontextprotocol/inspector python -m macos_screen_mcp

贡献

我们热烈欢迎任何形式的贡献,以帮助扩展和改进 macos - screen - mcp。无论您是想添加新功能、增强现有功能,还是改进文档,您的意见都非常宝贵。欢迎提交拉取请求!请随意提出新想法、错误修复或改进建议,让 macos - screen - mcp 变得更强大、更实用。

📄 许可证

macos - screen - mcp 采用 MIT License 许可证。这意味着您可以自由使用、修改和分发该软件,但需遵守 MIT License 的条款和条件。如需详细信息,请参阅项目存储库中的 LICENSE 文件。

  • 0 关注
  • 0 收藏,40 浏览
  • system 提出于 2025-09-25 02:48

相似服务问题

相关AI产品