MCP 文档处理服务器借助 Docling 库,为用户提供强大的文档处理功能,满足多样化的文档处理需求。
你可以使用 pip 进行安装:
pip install -e .
使用标准输入输出(默认)或 SSE 传输启动服务器:
# 使用 stdio 传输(默认)
mcp-server-lls
# 使用 SSE 传输和自定义端口
mcp-server-lls --transport sse --port 8000
如果你使用 uv,可以直接运行服务器而不需安装:
# 使用 stdio 传输(默认)
uv run mcp-server-lls
# 使用 SSE 传输和自定义端口
uv run mcp-server-lls --transport sse --port 8000
~/.cache/mcp-docling/ 目录下缓存处理过的文档,提升重复请求性能。你可以将此服务器与 Llama Stack 结合使用,为你的大语言模型应用提供文档处理功能。确保有一个运行中的 Llama Stack 实例。
# 以下是一个示例代码:
_summary_and_qna('https://arxiv.org/pdf/2004.07606')
服务器公开了以下工具:
convert_document:将来自 URL 或本地路径的文档转换为 Markdown 格式
source:文档的 URL 或本地文件路径(必需)enable_ocr:是否启用 OCR 处理扫描件(可选,默认:false)ocr_language:OCR 语言代码列表,例如 ["en", "fr"](可选)convert_document_with_images:转换文档并提取嵌入的图片
source:文档的 URL 或本地文件路径(必需)enable_ocr:是否启用 OCR 处理扫描件(可选,默认:false)ocr_language:OCR 语言代码列表(可选)extract_tables:提取文档中的表格并以结构化数据形式返回
source:文档的 URL 或本地文件路径(必需)convert_batch:批量处理多个文档
sources:文档 URL 或文件路径的列表(必需)enable_ocr:是否启用 OCR 处理扫描件(可选,默认:false)ocr_language:OCR 语言代码列表(可选)qna_from_document:将文档转换为 YAML 格式的 Q&A 文件
source:文档的 URL 或本地文件路径(必需)no_of_qnas:预期问答对的数量(可选,默认:5)⚠️ 重要提示
此工具需要 IBM Watson X 凭证,设置环境变量:
WATSONX_PROJECT_ID:你的 Watson X 项目 IDWATSONX_APIKEY:你的 IBM Cloud API KeyWATSONX_URL:Watson X API 地址(默认:https://us-south.ml.cloud.ibm.com)
get_system_info:获取系统配置和加速状态的信息
服务器在 ~/.cache/mcp-docling/ 目录下缓存处理过的文档,以提高重复请求的性能。