这是一个具备命令行功能的 PyTorch 文档语义搜索原型,能够帮助用户在 PyTorch 文档中进行语义查询,但目前因重大重构而暂停开发。
创建包含所有依赖项的 conda 环境:
conda env create -f environment.yml
conda activate pytorch_docs_search
工具需要 OpenAI API 密钥用于嵌入生成:
export OPENAI_API_KEY=your_key_here
# 使用直接查询搜索
python scripts/search.py "your search query here"
# 运行交互模式
python scripts/search.py --interactive
# 其他选项
python scripts/search.py "query" --results 5 # 限制为 5 个结果
python scripts/search.py "query" --filter code # 只显示代码结果
python scripts/search.py "query" --json # 输出 JSON 格式
✅ 基本语义搜索:带有命令行界面的文档查询
✅ 向量数据库:ChromaDB 集成用于存储和查询嵌入
✅ 内容区分:区分代码和文本内容
✅ 交互模式:运行连续交互式查询会话的选项
使用以下命令安装所需库:
pip install -r requirements.txt
运行以下命令启动搜索工具:
python scripts/run.py
$ python scripts/search.py "如何在 PyTorch 中绘制多注意力头?"
找到 5 个结果,针对 'How are multi-attention heads plotted out in PyTorch?':
--- 结果1(代码) ---
标题:plot_visualization_utils.py
来源:plot_visualization_utils.py
得分:0.3714
摘录:# models. Let's start by analyzing the output of a Mask-RCNN model. Note that...
--- 结果2(代码) ---
标题:plot_transforms_getting_started.py
来源:plot_transforms_getting_started.py
得分:0.3571
摘录:https://github.com/pytorch/vision/tree/main/gallery/...
ptsearch/core/:核心搜索功能(数据库、嵌入、搜索)ptsearch/config/:配置管理ptsearch/utils/:实用函数和日志记录scripts/:命令行工具data/:嵌入文档和数据库ptsearch/protocol/:MCP 协议处理(当前未使用)ptsearch/instructions/:MCP 指令集(当前未使用)该工具提供了一个基本的命令行搜索界面,用于查询 PyTorch 文档,但需要在多个方面进行实质性改进。尽管核心嵌入和搜索功能在基本层面上正常工作,但在相关性和 MCP 集成方面仍需进一步开发。
文档未提及相关信息,故跳过该章节。
⚠️ 重要提示
该项目目前因重大重构而暂停。
💡 使用建议
使用前请确保已正确设置环境和 API 密钥。