本项目基于fastmcp库构建了MCP(模型上下文协议)服务器(server.py)。它能与Kaggle API交互,实现数据集的搜索与下载功能,还能生成用于EDA笔记本的提示,为数据处理和分析提供便利。
此Kaggle MCP服务器能帮助你便捷地与Kaggle API交互,完成数据集的搜索、下载以及EDA笔记本提示的生成。以下为你详细介绍操作步骤。
git clone
cd
python -m venv venv
source venv/bin/activate # 在Windows上使用`venv\Scripts\activate`
# 或使用uv:uv venv
pip install -r requirements.txt
创建或复制.env文件并添加以下内容:
KAGGLE_USERNAME=your_kaggle_username
KAGGLE_KEY=your_kaggle_key
在终端中运行:
python server.py
服务器启动后,你可以通过配置MCP客户端或AI代理进行交互。
search_kaggle_datasets(query: str):用于搜索Kaggle数据集,会返回与查询相关的结果列表。download_kaggle_dataset(dataset_ref: str, download_path: Optional[str] = None):可下载指定的Kaggle数据集。
dataset_ref:格式为username/dataset-slug(例如,kaggle/titanic)。download_path(可选):指定下载位置。若未提供,默认为./datasets// 。generate_eda_notebook(dataset_ref: str):生成适合AI模型(如Gemini)的提示消息,用于创建指定Kaggle数据集的基本探索性数据分析(EDA)笔记本。提示要求生成涵盖数据加载、缺失值检查、可视化和基本统计的Python代码。打开Claude > 设置 > 开发者 > 编辑配置 > claude_desktop_config.json。
添加以下内容:
{
"mcpServers": {
"kaggle-mcp": {
"command": "kaggle-mcp",
"cwd": "/kaggle-mcp"
}
}
}
保存文件并重启Claude Desktop。
AI代理或MCP客户端可以与服务器交互如下:
search_kaggle_datasets(query='heart disease')download_kaggle_dataset(dataset_ref='user/heart-disease-dataset')generate_eda_notebook(dataset_ref='user/heart-disease-dataset')通过以上步骤,你可以轻松使用此Kaggle MCP服务器进行数据集搜索、下载和EDA笔记本生成。
server.py:FastMCP服务器应用程序,定义了资源、工具和提示,用于与Kaggle交互。.env.example:环境变量示例文件(Kaggle API凭证),需重命名为.env并填写你的详细信息。requirements.txt:列出所需的Python包。pyproject.toml 和 uv.lock:项目元数据和锁定依赖项的uv包管理器。datasets/:下载Kaggle数据集的默认目录。