MacOS Screenshot

MacOS Screenshot

🚀 MCP 截图

MCP 截图是一个强大的 MCP 服务器,它能够捕获截图,并对截图内容执行 OCR 文本识别,为处理图像文字信息提供了极大的便利。

点击此处

✨ 主要特性

  • 📸 截图捕捉:支持捕获屏幕的左半部分、右半部分以及全屏截图。
  • 📖 OCR 文字识别:可对日语和英语进行准确的文字识别。
  • 📄 多种输出格式:提供 JSON、Markdown、垂直、水平等多种输出格式,满足不同场景需求。

📚 详细文档

OCR 引擎

此服务器使用两种 OCR 引擎:

  1. yomitoku
    • 主要 OCR 引擎,具备高精度的日语文本识别能力。
    • 以 API 服务器的形式运行。
  2. Tesseract.js
    • 回退 OCR 引擎,当 yomitoku 不可用时发挥作用。
    • 支持日语和英语识别。

工具规范

capture

捕获截图并执行 OCR。 选项:

  • region:截图区域(可选值为 'left'、'right'、'full',默认值为 'left')。
  • format:输出格式(可选值为 'json'、'markdown'、'vertical'、'horizontal',默认值为 'markdown')。

📦 安装指南

在终端中运行以下命令进行安装:

npx -y @kazuph/mcp-screenshot

Claude Desktop 配置

将以下配置添加到你的 claude_desktop_config.json 文件中:

{
"mcpServers": {
"screenshot": {
"command": "npx",
"args": ["-y", "@kazuph/mcp-screenshot"],
"env": {
"OCR_API_URL": "http://localhost:8000"  // yomitoku API 基础 URL
}
}
}
}

环境变量

属性 详情
OCR_API_URL yomitoku API 基础 URL,默认值为 http://localhost:8000

💻 使用示例

基础用法

你可以通过指示 Claude 如下使用它:

请捕获屏幕的左半部分并识别其中的文字。

📄 许可证

本项目采用 MIT 许可证。

👨‍💻 作者

kazuph

  • 0 关注
  • 0 收藏,24 浏览
  • system 提出于 2025-10-01 02:42

相似服务问题

相关AI产品