MCP Firecrawl 服务器是一个简单的MCP服务器,提供使用Firecrawl API进行网站抓取和结构化数据提取的工具,能帮助用户高效地从网站获取所需内容和数据。
本服务器提供了便捷的使用方式,您可以按照以下步骤快速启动并使用。
npm install
.env文件,并添加以下变量:FIRECRAWL_API_TOKEN=your_token_here
SENTRY_DSN=your_sentry_dsn_here
FIRECRAWL_API_TOKEN(必需):您的Firecrawl API令牌SENTRY_DSN(可选):Sentry DSN用于错误跟踪和性能监控npm start
或者直接通过命令行设置环境变量启动服务器:
FIRECRAWL_API_TOKEN=your_token_here npm start
服务器提供了两个工具:
scrape-website:基本网站抓取,支持多种输出格式extract-data:基于提示和模式的结构化数据提取此工具抓取网站并返回所需格式的内容。
参数:
url(字符串,必需):要抓取的网站URLformats(字符串数组,可选):所需输出格式的数组。支持格式包括:
"markdown"(默认)"html""text"示例使用MCP Inspector:
# 基本用法(默认为Markdown)
mcp-inspector --tool scrape-website --args '{
"url": "https://example.com"
}'
# 多种格式
mcp-inspector --tool scrape-website --args '{
"url": "https://example.com",
"formats": ["markdown", "html", "text"]
}'
此工具根据提供的提示和模式,从网站中提取结构化数据。
参数:
urls(字符串数组,必需):要提取数据的URL列表prompt(字符串,必需):描述要提取的数据的提示schema(对象,必需):定义要提取的数据模式模式定义是一个对象,键为字段名称,值为类型。支持的类型包括:
"string":文本字段"boolean":布尔值(true/false)"number":数字["type"],其中 type 是上述任一类型示例使用MCP Inspector:
# 基本示例提取公司信息
mcp-inspector --tool extract-data --args '{
"urls": ["https://example.com"],
"prompt": "Extract the company mission, whether it supports SSO, and whether it is open source.",
"schema": {
"company_mission": "string",
"supports_sso": "boolean",
"is_open_source": "boolean"
}
}'
# 复杂示例提取嵌套数据
mcp-inspector --tool extract-data --args '{
"urls": ["https://example.com"],
"prompt": "Extract detailed user information including name, age, and address.",
"schema": {
"user": {
"name": "string",
"age": "number",
"address": {
"street": "string",
"city": "string",
"country": "string"
}
}
}
}'