Hub Semantic Search Mcp

Hub Semantic Search Mcp

🚀 Hugging Face Hub语义搜索MCP服务器

本项目是一个MCP(模型上下文协议)服务器,为Hugging Face的模型和数据集提供语义搜索功能。借助该服务器,Claude及其他支持MCP的客户端能够使用自然语言查询,在Hugging Face生态系统中进行搜索、发现和探索。

⚠️ 重要提示

这是一个受Hugging Face官方MCP服务器启发而创建的非官方MCP服务器。如果官方推出了替代功能,该服务器可能随时被弃用。如需使用官方服务器,请访问 hf.co/mcp

✨ 主要特性

  • 语义搜索:由人工智能驱动的相似度搜索(不仅仅是关键词匹配)
  • 数据集搜索:根据自然语言描述查找数据集
  • 模型搜索:可选择按参数数量筛选查找模型
  • 相似度搜索:查找与给定模型/数据集相似的内容
  • 热门内容:获取当前热门的模型和数据集
  • 详细元数据:通过Hugging Face API访问全面的技术信息
  • 模型/数据集卡片:下载README卡片以获取详细信息

🛠️ 可用工具

数据集工具

  • search_datasets:使用自然语言查询搜索数据集
  • find_similar_datasets:查找与指定数据集相似的数据集
  • get_trending_datasets:获取当前热门的数据集
  • get_dataset_info:获取特定数据集的详细元数据
  • download_dataset_card:下载数据集的README卡片

模型工具

  • search_models:使用自然语言查询并可按参数筛选搜索模型
  • find_similar_models:查找与指定模型相似的模型
  • get_trending_models:获取当前热门的模型,并可按参数筛选
  • get_model_info:获取特定模型的详细元数据
  • get_model_safetensors_metadata:从safetensors中获取模型架构细节和参数数量
  • download_model_card:下载模型的README卡片

📦 安装指南

前提条件

  • UV - 快速Python包安装器
  • Claude Desktop或其他支持MCP的客户端

快速开始

无需安装!UV将自动获取并运行服务器。

⚙️ 配置

Claude Desktop设置

将以下内容添加到Claude Desktop配置文件中:

macOS~/Library/Application Support/Claude/claude_desktop_config.json
Windows%APPDATA%/Claude/claude_desktop_config.json

{
"mcpServers": {
"huggingface-hub-search": {
"command": "uvx",
"args": [
"git+https://github.com/davanstrien/hub-semantic-search-mcp.git"
],
"env": {
"HF_SEARCH_API_URL": "https://davanstrien-huggingface-datasets-search-v2.hf.space"
}
}
}
}

替代方案:本地开发设置

如果您想贡献代码或修改代码:

# 克隆仓库
git clone https://github.com/davanstrien/hub-semantic-search-mcp.git
cd hub-semantic-search-mcp

# 使用UV安装依赖项
uv sync

然后配置Claude Desktop以使用本地版本:

{
"mcpServers": {
"huggingface-hub-search": {
"command": "uv",
"args": [
"--directory",
"/path/to/hub-semantic-search-mcp",
"run",
"python",
"app.py"
],
"env": {
"HF_SEARCH_API_URL": "https://davanstrien-huggingface-datasets-search-v2.hf.space"
}
}
}
}

💻 使用示例

配置完成后,您可以在Claude Desktop中使用这些工具:

搜索数据集

"查找关于气候变化和天气模式的数据集"

搜索模型

"查找参数少于10亿的小型语言模型,用于文本生成"

查找相似内容

"查找与问答数据集 'squad' 相似的数据集"

获取热门内容

"显示本周排名前十的热门AI模型"

获取详细元数据

"获取 'stanford-nlp/imdb' 数据集的详细信息" "显示 'microsoft/DialoGPT-medium' 的技术细节和配置" " 'microsoft/DialoGPT-medium' 的参数数量和架构是什么?"

下载文档

"下载 'microsoft/DialoGPT-medium' 的模型卡片"

🌐 环境变量

  • HF_SEARCH_API_URL:搜索API的基础URL(默认:https://davanstrien-huggingface-datasets-search-v2.hf.space)

🔍 搜索后端

此MCP服务器连接到一个语义搜索API,该API使用人工智能生成的摘要对Hugging Face的模型和数据集进行索引。搜索使用基于嵌入的相似度,而不是关键词匹配,因此在根据意图和含义发现相关内容方面更加有效。

🛠️ 开发

本地运行

# 直接运行服务器
uv run python app.py

# 或者激活虚拟环境
uv shell
python app.py

使用MCP Inspector进行测试

# 测试GitHub版本
npx @modelcontextprotocol/inspector uvx git+https://github.com/davanstrien/hub-semantic-search-mcp.git

# 或者进行本地测试
npx @modelcontextprotocol/inspector uv run python app.py

🤝 贡献代码

欢迎贡献代码!请随时提交问题和拉取请求。

开发设置

git clone https://github.com/davanstrien/hub-semantic-search-mcp.git
cd hub-semantic-search-mcp
uv sync --dev

📄 许可证

本项目采用MIT许可证,详情请参阅LICENSE文件。

🔗 相关项目

  • 0 关注
  • 0 收藏,23 浏览
  • system 提出于 2025-09-22 18:36

相似服务问题

相关AI产品