RAT (Retrieval Augmented Thinking)

RAT (Retrieval Augmented Thinking)

🚀 深度思维-思考克劳德3.5-十四行诗-CLINE-MCP

本项目是一个结合了深度思维R1推理能力和克劳德3.5十四行诗回应生成能力的模型上下文协议(MCP)服务器,通过OpenRouter实现。它采用两阶段过程,先由深度思维进行结构化推理,再将推理结果融入克劳德的回应生成中,为用户提供更智能、全面的对话体验。

🚀 快速开始

本项目可通过Smithery自动安装,也支持手动安装,以下为你详细介绍安装步骤:

使用Smithery安装

通过Smithery自动为Claude Desktop安装深度思维思考与克劳德3.5十四行诗:

npx -y @smithery/cli install @newideas99/Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP --client claude

手动安装

  1. 克隆仓库:
git clone https://github.com/yourusername/Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP.git
cd Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP
  1. 创建并激活虚拟环境(可选但推荐):
python -m venv env
source env/bin/activate  # 在Linux/Mac上
env\Scripts\activate      # 在Windows上
  1. 安装依赖项:
pip install -r requirements.txt
  1. 运行服务器:
python app.py

✨ 主要特性

两阶段处理

  • 使用深度思维R1进行初始推理(50k字符上下文)。
  • 使用克劳德3.5十四行诗进行最终回应(600k字符上下文)。
  • 两个模型均通过OpenRouter的统一API访问。
  • 将深度思维的推理令牌注入到克劳德的上下文中。

智能对话管理

  • 使用文件修改时间检测活动对话。
  • 处理多个并发对话。
  • 自动过滤已结束的对话。
  • 在需要时支持上下文清除。

优化参数

  • 模型特定上下文限制
    • 深度思维:50,000字符用于专注推理。
    • 克劳德:600,000字符用于全面回应。
  • 推荐设置
    • temperature: 0.7(创造力平衡)。
    • top_p: 1.0(完整的概率分布)。
    • repetition_penalty: 1.0(防止重复)。

💻 使用示例

推理阶段(深度思维R1)

  • 使用OpenRouter的推理令牌功能。
  • 提示词被修改以输出'完成',同时捕获推理内容。
  • 推理从响应元数据中提取。

回应阶段(克劳德3.5十四行诗)

  • 收到原始提示和深度思维的推理内容。
  • 生成最终回应,结合推理内容。
  • 维护对话上下文和历史记录。

📚 详细文档

开发

对于带有自动重建的功能开发:

npm run watch

📄 许可证

本项目采用MIT License,有关详细信息,请参阅LICENSE文件。

👥 贡献者

本项目基于Skirano的概念RAT(检索增强思考),该概念通过结构化推理和知识检索增强了AI回应。

  • 0 关注
  • 0 收藏,28 浏览
  • system 提出于 2025-10-02 16:54

相似服务问题

相关AI产品