此MCP服务器能够抓取网站(包括需要身份验证的网站),并将其转换为PDF或Markdown文档。它还支持遍历网页上的链接,将生成的文档包含在内,或者返回发现的URL,为网页内容处理提供了便利。
此MCP服务器可帮助你轻松将网站转换为PDF或Markdown文档,以下是快速开始的步骤:
npm install
cp .env.example .env
npm start
npm install
cp .env.example .env
npm start
POST /api/convert
请求正文:
{
"url": "https://example.com",
"username": "optional-username",
"password": "optional-password",
"traverseLinks": true,
"maxPages": 10
}
参数说明:
url:(必填)要转换为PDF的URL。username:(可选)用于身份验证的用户名。password:(可选)用于身份验证的密码。traverseLinks:(可选)是否遍历网页上的链接(默认值:false)。maxPages:(可选)遍历链接时处理的最大页面数(默认值:10)。
响应:响应将是一个PDF文档,带有适当的Content-Type头。Content-Type: application/pdf
Content-Disposition: attachment; filename="example_com.pdf"
二进制的PDF内容直接在响应正文返回。
POST /api/to-markdown
请求正文:
{
"url": "https://example.com",
"username": "optional-username",
"password": "optional-password"
}
参数:与/api/convert相同。
响应:响应将是一个Markdown文档,带有适当的Content-Type头。
Content-Type: text/markdown
Markdown内容直接在响应正文返回。
POST /api/get-urls
请求正文:
{
"url": "https://example.com",
"username": "optional-username",
"password": "optional-password"
}
参数:与/api/convert相同。
响应:响应将是一个JSON数组,包含所有发现的URL。
[
"https://example.com/page1",
"https://example.com/page2",
...
]
对于本地开发,你可以使用工具如ngrok将本地服务器暴露到互联网:
npm start
# 在另一个终端
ngrok http 3000
然后在Claude中设置MCP时使用ngrok URL。
通过此MCP服务器,你可以在与Claude的对话中直接使用以下功能: