本服务器提供无结构化文档处理功能,能让大型语言模型(LLMs)从无结构化文档中提取并使用内容。
⚠️ 重要提示
此仓库正在开发中,请谨慎使用 :)
本服务器支持以下多种文件类型:
{".abw", ".bmp", ".csv", ".cwk", ".dbf", ".dif", ".doc", ".docm", ".docx", ".dot",
".dotm", ".eml", ".epub", ".et", ".eth", ".fods", ".gif", ".heic", ".htm", ".html",
".hwp", ".jpeg", ".jpg", ".md", ".mcw", ".mw", ".odt", ".org", ".p7s", ".pages",
".pbd", ".pdf", ".png", ".pot", ".potm", ".ppt", ".pptm", ".pptx", ".prn", ".rst",
".rtf", ".sdp", ".sgl", ".svg", ".sxg", ".tiff", ".txt", ".tsv", ".uof", ".uos1",
".uos2", ".web", ".webp", ".wk2", ".xls", ".xlsb", ".xlsm", ".xlsx", ".xlw", ".xml",
".zabw"}
你需要准备以下内容:
.env文件,并在其中添加以下环境变量:UNSTRUCTURED_API_KEY。uv run doc_processor.py~/Library/Application Support/Claude/并创建一个claude_desktop_config.json文件。在该文件中添加以下内容:{
"mcpServers": {
"unstructured_doc_processor": {
"command": "YOUR UV PATH",
"args": [
"--directory",
"ABSOLUTE PATH TO YOUR unstructured-mcp/",
"run",
"doc_processor.py"
],
"disabled": false
}
}
}