一个为 Scrapezy 设计的 Model Context Protocol(MCP)服务器,它能够让 AI 模型从网站中提取结构化数据,为数据提取工作提供了高效且便捷的解决方案。
extract_structured_data - 此工具用于提取网站中的结构化数据。
你可以通过 Smithery 自动为 Claude Desktop 安装 Scrapezy MCP 服务器,只需执行以下命令:
npx -y @smithery/cli install @Scrapezy/mcp --client claude
若选择手动安装,可使用以下命令:
npm install -g @scrapezy/mcp
提供 Scrapezy API 密钥有以下两种方式:
export SCRAPEZY_API_KEY=你的_api_密钥
npx @scrapezy/mcp
npx @scrapezy/mcp --api-key=你的_api_密钥
与 Claude Desktop 一起使用时,请添加服务器配置:
~/Library/Application Support/Claude/claude_desktop_config.json%APPDATA%/Claude/claude_desktop_config.json
配置内容如下:{
"mcpServers": {
"scrapezy": {
"command": "npx @scrapezy/mcp --api-key=你的_api_密钥"
}
}
}
可以使用以下提示在 Claude 中调用此工具:
请从这个页面提取信息:https://example.com/product
请提取产品名称、价格、描述和可用颜色。
Claude 将使用 MCP 服务器从网站中提取所需的结构化数据。
由于 MCP 服务器通过标准输入输出进行通信,调试可能会比较困难。我们推荐使用 MCP Inspector,它可以通过脚本命令运行:
npm run inspector
Inspector 会提供一个可在浏览器中访问调试工具的 URL。
本项目采用 MIT 许可证。