MCP 获取服务器基于模型上下文协议(Model Context Protocol),具备网络内容抓取的强大能力。它能让大语言模型(LLMs)从网页抓取并处理内容,还能将 HTML 转换为 Markdown 格式,极大提升了内容的可读性。
获取工具会截断响应内容,但借助 start_index 参数,您可以指定内容提取的起始位置。如此一来,模型便能分段读取网页,直至找到所需信息。
start_index 参数指定内容提取的起始位置,实现网页分段读取。安装 node.js,这能让获取服务器使用更强大的 HTML 简化器。
当使用 uv 时,无需进行任何特定安装。我们将使用 uvx 直接运行 mcp-server-fetch。
您也可以通过 pip 安装 mcp-server-fetch:
pip install mcp-server-fetch
fetch - 抓取互联网上的 URL 并将其内容提取为 Markdown 格式。
url (字符串, 必填):需要抓取的 URL。max_length (整数, 可选):返回的最大字符数(默认: 5000)。start_index (整数, 可选):从该字符索引开始提取内容(默认: 0)。raw (布尔值, 可选):不进行 Markdown 转换获取原始内容(默认: false)。url (字符串, 必填):需要抓取的 URL。