本项目是一个基于 Model Context Protocol (MCP) 的服务器,可从 PDF 文件中阅读和提取文本内容,支持本地文件和 URL 两种方式,为用户提供便捷的 PDF 文本读取服务。
git clone https://github.com/trafflux/pdf-reader-mcp.git
cd pdf-reader-mcp
docker build -t mcp/pdf-reader .
要运行具有访问本地 PDF 文件权限的服务器:
docker run -i --rm -v /path/to/pdfs:/pdfs mcp/pdf-reader
请将 /path/to/pdfs 替换为实际的 PDF 文件路径。
若不使用本地 PDF 文件:
docker run -i --rm mcp/pdf-reader
添加到您的 MCP 设置配置中:
{
"mcpServers": {
"pdf-reader": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"-v",
"/path/to/pdfs:/pdfs",
"mcp/pdf-reader"
],
"disabled": false,
"autoApprove": []
}
}
}
不使用本地 PDF 文件的情况:
{
"mcpServers": {
"pdf-reader": {
"command": "docker",
"args": ["run", "-i", "--rm", "mcp/pdf-reader"],
"disabled": false,
"autoApprove": []
}
}
}
read_local_pdf{
"path": "/pdfs/document.pdf"
}
{
"success": true,
"data": {
"text": "提取的内容..."
}
}
read_pdf_url{
"url": "http://example.com/example.pdf"
}
{
"success": true,
"data": {
"text": "提取的内容..."
}
}
服务器在遇到错误时会返回以下 JSON 格式的响应:
{
"success": false,
"error": {
"code": " ErrorCode ",
"message": " 错误信息 "
}
}
其中,ErrorCode 是一个唯一的错误代码,Error Message 描述了具体的错误原因。
.
├── README.md # 项目文档
├── requirements.txt # 依赖项列表
├── app.py # 主应用程序文件
└── config.py # 配置文件
本项目受 Apache License 2.0 许可证的约束。详细内容请参考 LICENSE 文件。
Philip Van de Walker
邮箱:philip.vandewalker@gmail.com
GitHub:https://github.com/trafflux
如需联系,请发送邮件至 philip.vandewalker@gmail.com 或访问 GitHub 仓库:https://github.com/trafflux/pdf-reader-mcp