这是一个使用爬取4AI(crawl4ai)和快速MCP(fastmcp)协议构建的知识库系统,允许用户通过自然语言查询从文档中获取信息,为知识检索提供了便捷的途径。
本知识库系统能让你通过自然语言查询文档信息。下面将为你介绍如何安装和使用该系统。
此系统基于爬取4AI(crawl4ai)和快速MCP(fastmcp)协议构建,可借助自然语言查询从文档里获取信息。
git clone git@github.com:yourusername/MCPDocSearch.git
cd MCPDocSearch
uv env create --python 3.8+
pip install -r requirements.txt
项目包含以下关键部分:
crawler_cli:负责网页爬取和文档生成。mcp_server:实现MCP协议,提供知识库查询接口。./storage/目录。uv run python -m mcp_server.main
在项目根目录下创建.cursor/mcp.json文件,内容如下:
{
"mcpServers": {
"doc-query-server": {
"command": "uv",
"args": [
"--directory",
"/your/MCPDocSearch/absolute/path",
"run",
"python",
"-m",
"mcp_server.main"
],
"env": {}
}
}
}
关键库包括:
系统遵循以下流程:
pickle模块缓存处理数据。为确保安全,请保证./storage/目录仅被受信任的用户或进程访问。⚠️ 重要提示
- 确保缓存目录
./storage/仅被授权用户访问。- 定期清理旧文档以减少潜在的安全风险。