本项目可让你从glama.ai抓取并提取MCP网络服务器相关信息。下面为你详细介绍设置和运行该抓取器的步骤。
本MCP服务器抓取器能帮助你从指定网站抓取并提取MCP网络服务器的相关数据,操作简单便捷,助你高效获取所需信息。
git clone https://github.com/Neche-Stephen/mcp_web_scrapper
cd mcp_web_scrapper
npm install
在运行新的抓取任务前,你需要检查servers-json文件夹的情况:
servers-json文件夹是否存在。servers-json文件夹,可使用以下命令:rm -rf servers-json
运行抓取器来收集所有MCP服务器链接,使用以下命令:
node scraper.js
输出结果:在
servers-json文件夹中会生成一个名为server-links.json的文件,其中包含所有抓取到的链接。
现在,使用以下命令从每个服务器链接获取详细信息:
node process-links.js
server-links.json文件并访问每个链接以抓取必要的数据。所有抓取的数据将存储在
servers-json目录中的不同文件中,文件名即为相应的MCP服务器名称。