Ragdocs

笔记官方认证本地 TypeScript

🚀 RagDocs 文档知识图谱服务器

RagDocs 是一个模型上下文协议（MCP）服务器，借助 Qdrant 向量数据库与 Ollama/OpenAI 嵌入模型，实现检索增强生成（RAG）功能。它能通过向量相似度，高效完成文档的语义搜索与管理。

🚀 快速开始

要使用 RagDocs 文档知识图谱服务器，你需要满足以下先决条件，并完成安装和配置。

先决条件

Node.js 16 或更高版本
下列之一的 Qdrant 设置：
- 使用 Docker 的本地实例（免费）
- 带 API 密钥的 Qdrant 云账户（托管服务）
下列之一用于嵌入模型：
- 本地运行的 Ollama（默认，免费）
- OpenAI API 密钥（可选，付费）

安装

npm install -g @mcpservers/ragdocs

配置

MCP 服务器

编辑 config.json 文件：

{
"mcp_port": 5000,
"db_path": "./db",
"log_level": "info"
}

启动 MCP 服务器

在终端运行：

node index.js

环境变量

MCP_PORT：指定 MCP 服务器的端口（默认：5000）
DB_PATH：指定数据库文件的存储路径（默认：./db）
LOG_LEVEL：设置日志级别（info/debug/warn/error）

安装依赖

在终端运行：

npm install express pg jsonwebtoken cors dotenv sequelize

✨ 主要特性

添加带有元数据的文档：可为文档添加元数据，方便后续管理和检索。
通过语义相似度搜索文档：基于向量相似度，实现高效的语义搜索。
列出并组织文档：支持分页和分组选项，便于对文档进行管理。
删除文档：可根据文档 URL 删除指定文档。
支持 Ollama（免费）和 OpenAI（付费）嵌入模型：提供多种选择，满足不同需求。
自动文本分块和嵌入生成：提高文档处理效率。
使用 Qdrant 进行向量存储：确保向量数据的高效存储和检索。

📚 详细文档

可用工具

1. add_document

将文档添加到 RAG 系统。

参数	详情
`url`（必需）	文档 URL/标识符
`content`（必需）	文档内容
`metadata`（可选）	文档元数据 - `title`：文档标题 - `contentType`：内容类型（例如，“text/markdown”）

2. search_documents

使用语义相似度搜索存储的文档。

参数	详情
`query`（必需）	自然语言搜索查询
`options`（可选）	- `limit`：结果的最大数量（1 - 20，默认：5） - `scoreThreshold`：最小相似度得分（0 - 1，默认：0.7） - `filters`： - `domain`：按领域过滤 - `hasCode`：筛选包含代码的文档 - `after`：筛选在特定日期之后的文档（ISO 格式） - `before`：筛选在特定日期之前的文档（ISO 格式）

3. list_documents

列出所有存储的文档，支持分页和分组选项。

参数（全部可选）	详情
`page`	页码（默认：1）
`pageSize`	每页的文档数量（1 - 100，默认：20）
`groupByDomain`	按领域分组（默认：false）
`sortBy`	排序字段（“timestamp”，“title” 或 “domain”）
`sortOrder`	排序顺序（“asc” 或 “desc”）

4. delete_document

从 RAG 系统中删除文档。

参数	详情
`url`（必需）	要删除的文档 URL

📄 许可证

本项目采用 Apache License 2.0 许可证。

0 条评论
分类：笔记