Mozilla 可读性解析器 MCP 服务器是一个基于 Python 的项目,它依据 Model Context Protocol (MCP) 实现。该服务器的主要功能是提取网页内容,并将其转换为适合大语言模型(LLM)处理的干净 Markdown 格式,有效提升内容处理效率。
fastmcp run server.py
curl -X POST http://localhost:8000/tools/extract_content \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com/article"}'
与简单的抓取请求相比,此服务器具备以下优势:
git clone https://github.com/jmh108/MCP-server-readability-python.git
cd MCP-server-readability-python
python -m venv venv
source venv/bin/activate # 在 Windows 上使用:venv\Scripts\activate
pip install -r requirements.txt
extract_content该工具用于抓取并转换网页内容为干净的 Markdown。
参数:
{
"url": {
"type": "string",
"description": "要解析的网站 URL",
"required": true
}
}
返回值:
{
"content": "Markdown 内容..."
}
要在 MCP 设置文件中配置该服务器,请添加以下内容:
{
"mcpServers": {
"readability": {
"command": "fastmcp",
"args": ["run", "server.py"],
"env": {}
}
}
}
然后可以通过 parse 工具启动并访问该服务器。
本项目使用 MIT 许可证。有关详细信息,请参阅 LICENSE 文件。