MCP服务器提供了计算机控制功能,涵盖鼠标、键盘操作以及OCR等。它借助PyAutoGUI、RapidOCR和ONNXRuntime实现,类似于Anthropic的'computer - use',且无需外部依赖。

uvx进行MCP设置{
"mcpServers": {
"computer-control-mcp": {
"command": "uvx",
"args": ["computer-control-mcp@latest"]
}
}
}
pip全局安装pip install computer-control-mcp
安装完成后,运行服务器:
computer-control-mcp # 而不是使用uvx computer-control-mcp,这样您可以使用最新版本。还可以使用`uv cache clean`清除缓存并再次使用`uvx`以获取最新版本。
uvx配置{
"mcpServers": {
"computer-control-mcp": {
"command": "uvx",
"args": ["computer-control-mcp@latest"]
}
}
}
pip全局安装pip install computer-control-mcp
以下是一些基础操作的代码示例:
# 鼠标点击
from computer_control_mcp import click_screen
click_screen(100, 200)
# 输入文本
from computer_control_mcp import type_text
type_text("Hello, World!")
以下是使用OCR进行屏幕文字提取的示例:
from computer_control_mcp import take_screenshot
result = take_screenshot(with_ocr_text_and_coords=True)
print(result)
click_screen(x: int, y: int):在指定屏幕坐标处点击move_mouse(x: int, y: int):将鼠标光标移动到指定坐标drag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5):从一个位置拖动鼠标到另一个位置type_text(text: str):在当前光标位置输入指定文本press_key(key: str):按下指定的键盘按键take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False):捕获屏幕或窗口,可选OCRget_screen_size():获取当前屏幕分辨率list_windows():列出所有打开的窗口activate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60):将指定窗口带到前台查看API参考获取详细信息,了解可用函数和类的详细信息。
本项目使用了PyAutoGUI、RapidOCR和ONNXRuntime实现计算机控制和OCR功能。PyAutoGUI用于鼠标和键盘控制,RapidOCR和ONNXRuntime用于光学字符识别。项目无外部依赖,仅在Windows上进行过测试,但其他平台可能也能使用。
本项目采用MIT许可证。
⚠️ 重要提示
本项目仅在Windows上测试过,其他平台可能也能使用,但不保证兼容性。
💡 使用建议
若想使用最新版本,可直接运行
computer-control-mcp;若需更新缓存,可使用uv cache clean清除缓存并再次使用uvx以获取最新版本。