InsightsLibrary

InsightsLibrary

🚀 洞察知识库(IKB)MCP 服务器

🍭这是一个免费的、即插即用的知识库。内置 10000+ 高质量洞察报告,以 MCP 服务器形式封装,并提供安全的本地数据存储。

>>>中文版

⚠️⚠️ 本项目中收集的所有报告均来自官方研究报告网站的免费资源。 ⚠️⚠️

✨ 主要特性

  1. 🍾 无需配置,真正的即插即用。对于私有文档解析,可在 .env 中配置 VLM 模型和参数(例如,VLM_MODEL_NAME=qwen2.5-vl-72b-instruct)。
  2. 🦉 永久免费 —— 无需费力收集报告资源。欢迎通过 issues 分享可靠的、无版权问题的报告来源。
  3. 📢 承诺每周更新报告,但 bug 修复取决于个人心情(实际上我不是工程师 🤭)。

📈 截至 6 月 17 日的优化更新

  1. 💡 优化 models.py:数据查询效率提高了 1000%。
  2. 💡 优化 extractor.py:PDF 提取效率略有提升。
  3. 💡 优化 recognizer.py:图像理解效率提高了 50%。
  4. 💡 优化 ikb_mcp_server.py
    • 添加了分页功能。
    • 显示引用文件的本地路径。
  5. 💡 添加 MIT 许可证(https://github.com/v587d/InsightsLibrary/pull/1#issuecomment-2969226661)。
  6. 📦 项目包整体压缩后,大小约减少了 50%
  7. 💡 简化私有文档处理。
  8. 💡 修复其他已发现的 bug。

🚀 未来工作方向

  1. 嵌入模型集成
    • 实现 sentence-transformers 进行文档嵌入。
    • 创建用于向量搜索的函数工具端点。
  2. 报告系统增强
    • 每日自动生成报告。
    • 实时更新通知。

📄 最新文件概况

{
"statistics": {
"total_files": 69,
"total_pages": 3758,
"unique_publishers": 7,
"unique_topics": 51,
"last_updated": "2025-06-18T20:09:57.012512"
},
"details": {
"publishers": [
"埃森哲",
"贝恩公司",
"波士顿咨询公司",
"哥伦比亚广播公司",
"麦肯锡公司",
"普华永道",
"亿欧"
],
"topics": [
"人工智能",
"AI 智能体",
"亚裔美国人",
"汽车",
"航空",
"商业",
"化工",
"消费品",
"脱碳",
"脱碳",
"数字化",
"经贸",
"教育",
"就业",
"时尚",
"金融",
"金融科技",
"金融科技",
"无肉食品",
"Z 世代",
"全球银行业",
"全球能源",
"全球保险",
"全球宏观经济",
"全球材料",
"全球私募市场",
"全球私募市场",
"全球贸易",
"健康",
"人力资本",
"保险",
"投资",
"低空经济",
"奢侈品",
"并购",
"海事",
"媒体",
"医疗健康",
"净零排放",
"新能源汽车",
"宠物食品",
"人口",
"私募股权",
"生产力",
"房地产",
"零售数字化",
"小企业",
"智能家居",
"可持续发展",
"科技",
"旅游"
]
}
}

📦 安装指南

💡 专业提示:遇到困难?将此页面拖到 LLM 客户端(如 DeepSeek),获取分步指导。实际上,这些说明也是由 DeepSeek 编写的...

前提条件:Python 3.12+(从官方网站下载并添加到环境变量)

安装 UV:

pip install uv

1. 克隆项目(确认已成功安装 Git 和 Git LFS)

git clone https://github.com/v587d/InsightsLibrary.git
cd InsightsLibrary
git lfs pull

2. 创建虚拟环境

uv venv .venv  # 创建专用虚拟环境

# 激活环境
# Windows:
.\.venv\Scripts\activate
# Mac/Linux:
source .venv/bin/activate

3. 安装核心依赖项

uv install .  # 注意末尾的点表示当前目录

4. 创建环境变量(以备将来使用)

notepad .env  # Windows
# 或者
nano .env     # Mac/Linux

5. 配置 MCP 服务器

  • VSCode.Cline

注意:将 替换为实际的项目根目录。

{
"mcpServers": {
"ikb-mcp-server": {
"command": "uv",
"args": [
"--directory",
"",
"run",
"ikb_mcp_server.py"
]
}
}
}
  • Cherry Studio
    • 命令:uv
    • 参数:
--directory

run
ikb_mcp_server.py

💻 使用示例

向 ikb_mcp_server 添加私有文档

  1. .env 中配置 VLM 模型和参数:
VLM_API_KEY=
VLM_BASE_URL=<基础 URL> # https://openrouter.ai/api/v1
VLM_MODEL_NAME=<模型名称> # qwen/qwen2.5-vl-72b-instruct:free
  1. 将 PDF 文档上传到项目根目录下的 library_files 文件夹。
  2. 手动运行 main.py。
# 导航到项目根目录
# 激活虚拟环境
uv run main.py
(InsightsLibrary) PS D:\Projects\mcp\InsightsLibrary> uv run main.py
[INFO] extractor: PDF 提取已初始化 | 文件目录:library_files | 页面目录:library_pages
[INFO] extractor: 开始扫描目录:library_files
[INFO] extractor: 找到 69 个 PDF 文件
[INFO] extractor: 扫描完成 | 总文件数:69 | 已处理:0 | 失败:0
[INFO] recognizer: 没有要处理的页面。
# 数据已更新到数据库
============================================================
确认是否需要创建文本向量嵌入
⚠️ 此过程大约需要 20 分钟
============================================================
是否创建嵌入?(输入 Y 或 N):
# Y:创建文本向量嵌入
# N:跳过文本向量嵌入并退出程序

📄 许可证

本项目采用 MIT 许可证。详情请参阅 LICENSE 文件。

  • 0 关注
  • 0 收藏,34 浏览
  • system 提出于 2025-09-19 04:48

相似服务问题

相关AI产品