mcp-webcam 可借助您的网络摄像头,将实时图像发送至 Claude Desktop(或其他 MCP 客户端)。它提供 "capture" 和 "screenshot" 工具,让 Claude 能从网络摄像头获取单帧图像或发起截图操作,还能提供网络摄像头的 当前视图 资源。
使用 mcp-webcam 前,你可以按照如下步骤进行操作,开启将网络摄像头实时图像发送到 Claude Desktop 的功能。
NPM 包名为 @llmindset/mcp-webcam。
请先安装适合您平台的最新版本 NodeJS,然后将以下内容添加到您的 claude_desktop_config.json 文件中的 mcpServers 部分:
"webcam": {
"command": "npx",
"args": [
"-y",
"@llmindset/mcp-webcam"
]
}
只要您使用的是 Claude Desktop 0.78 或更高版本,此工具将在 Windows 和 MacOS 上正常工作。该工具接受一个参数来设置嵌入式 Express 服务器的端口,默认端口为 3333(避免与 Inspector 冲突)。
启动 Claude Desktop 并连接到 http://localhost:3333。您可以要求 Claude 获取网络摄像头的最新图片,或说“Claude,请看看我正在展示什么”,或询问“我穿的是什么颜色的上衣?”。您还可以“冻结”当前图像,这样返回给 Claude 的将是冻结的图像而不是实时捕获。
您可以让 Claude 截取屏幕。导航到浏览器以指导截图区域,当请求到达时会触发截图。截图会自动调整大小以便于 Claude 处理(如果您的屏幕是 4K,则此功能非常有用)。该按钮允许测试平台特定的截图用户体验 - 它仅用于准备 Claude 发起的请求。注意:Safari 不支持此功能,因为它需要人工发起。
点击“我正在展示什么?”按钮以向客户端发送一个采样请求,其中包含图片和问题 用户正在展示什么?。
💡 使用建议 Claude Desktop 当前不支持采样。如果您希望使用能够处理多模态采样请求的客户端,请尝试 https://github.com/evalstate/fast-agent。
基本上就是这样。此 MCP 服务器旨在演示在 MCP 服务器上暴露用户界面,并将实时资源返回给 Claude Desktop。如果您想构建本地交互式 MCP 服务器,该项目可能会对您有帮助。
感谢 https://github.com/tadasant 在测试和设置方面的帮助。请阅读 https://llmindset.co.uk/posts/2025/01/mcp-files-resources-part1/ 以了解更多关于在 LLM / MCP 聊天应用程序中处理文件和资源的信息,以及为什么您可能希望这样做。