这是一个全面的模型上下文协议(MCP)服务器,用于处理 Microsoft Word(.docx)文档,支持完整的文档格式。
该服务器通过标准输入输出(stdio)运行,并通过 JSON-RPC 2.0 协议进行通信。
{
"jsonrpc": "2.0",
"id": 1,
"method": "tools/call",
"params": {
"name": "analyze_structure",
"arguments": {
"file_path": "/path/to/document.docx"
}
}
}
{
"file_path": "/path/to/document.docx"
}
此 MCP 服务器借助强大的 mammoth 库,提供了先进的 DOCX 文档处理能力:
npm install
npm run build
以下是使用 MCP 客户端调用 analyze_structure 工具的示例:
{
"jsonrpc": "2.0",
"id": 1,
"method": "tools/call",
"params": {
"name": "analyze_structure",
"arguments": {
"file_path": "/path/to/document.docx"
}
}
}
以下是使用 Roo 调用工具的示例:
{
"file_path": "/path/to/document.docx"
}
extract_text从 DOCX 文件中提取纯文本内容。 参数:
file_path(字符串):.docx 文件的路径
返回值:convert_to_html将 DOCX 文件转换为 HTML 格式并保留格式。 参数:
file_path(字符串):.docx 文件的路径include_styles(布尔值,可选):是否包含内联样式(默认:true)
返回值:analyze_structure分析文档结构、标题和格式元素。 参数:
file_path(字符串):.docx 文件的路径
返回值:extract_images从 DOCX 文件中提取并列出图像。 参数:
file_path(字符串):.docx 文件的路径output_dir(字符串,可选):保存提取图像的目录
返回值:convert_to_markdown将 DOCX 文件转换为 Markdown 格式。 参数:
file_path(字符串):.docx 文件的路径
返回值:convert_to_html 工具支持自定义样式映射,以生成更好的语义化 HTML 输出:
// 示例样式映射
"p[style-name='Heading 1'] => h1:fresh"
"r[style-name='Strong'] => strong"
"r[style-name='Emphasis'] => em"
提供全面的文档分析,包括:
安装依赖:
npm install
构建服务器:
npm run build
开发时自动重建:
npm run watch
要在 Claude Desktop 中使用该服务器,需添加服务器配置:
在 MacOS 上:~/Library/Application Support/Claude/claude_desktop_config.json
在 Windows 上:%APPDATA%/Claude/claude_desktop_config.json
{
"mcpServers": {
"docx-format-server": {
"command": "/path/to/docx-format-server/build/index.js"
}
}
}
@modelcontextprotocol/sdk:MCP 协议实现mammoth:高级 DOCX 处理库zod:模式验证typescript:TypeScript 支持所有工具都包含全面的错误处理,针对以下情况提供详细的错误消息:
由于 MCP 服务器通过标准输入输出进行通信,调试可能具有挑战性。建议使用 MCP Inspector,可通过以下命令运行:
npm run inspector
Inspector 将提供一个 URL,可在浏览器中访问调试工具。
ISC 许可证