Markdownify

Markdownify

🚀 Markdownify MCP 服务器(UTF - 8 版)

本项目是基于原始 Markdownify 项目的增强版本,专为更好地支持 UTF - 8 编码而开发,能将多种格式文件转换为 Markdown,为您的工作带来便利。

🚀 快速开始

安装要求

  • 系统:支持 Windows、macOS 或 Linux。
  • 依赖:需要安装 Node.js(推荐版本:16+)和 Python 3.x。

安装指南

步骤一:克隆仓库

git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git
cd markdownify-mcp-utf8

步骤二:安装依赖

npm install
pip install -r requirements.txt

步骤三:启动服务器

node dist/index.js

✨ 主要特性

主要改进

  1. 全面的 UTF - 8 支持:整个项目经过优化,确保在处理中文和其他 UTF - 8 字符时表现更稳定。
  2. Windows 系统兼容性提升:修复了 Windows 操作系统中的多项问题,提升了用户体验。
  3. 改进的功能模块
    • 更强大的文件解析能力。
    • 支持更多文件格式(如 PDF、PPTX 和 XLSX)。
    • 提升对 YouTube 视频的处理效率。
  4. 增强的错误处理:包括更详细的错误日志和自定义输出路径功能。

与原项目的主要区别

  • UTF - 8 支持优化:原项目在中文和其他非英语字符处理上存在一些问题,现版本已全面改进。
  • Windows 系统支持增强:解决了 Windows 用户在使用过程中遇到的多项问题。
  • 新增功能:提供了更灵活的环境变量配置(如 UV_PATHMARKDOWN_OUTPUT_DIR)。

功能

  • 支持将多种格式文件转换为 Markdown,包括 DOCX、PDF、PPTX、XLSX、YouTube 视频链接、网页内容。
  • 提供命令行工具和桌面应用集成支持。
  • 兼容 Node.js 和 Python 脚本环境。

💻 使用示例

命令行使用

基础用法

将网页转换为 Markdown:

python convert_utf8.py "https://example.com"

高级用法

  • 转换本地文件
    • DOCX 文件:
python convert_utf8.py "document.docx"
- PDF 文件:
python convert_utf8.py "document.pdf"
- PowerPoint 文件:
python convert_utf8.py "presentation.pptx"
- Excel 文件:
python convert_utf8.py "spreadsheet.xlsx"
  • 转换 YouTube 视频
python convert Utf8_py "https://www.youtube.com/watch?v=VIDEO_ID"

批处理操作

  1. 创建一个包含要处理的 URL 或文件路径的文本文件(例如 convert_batch.txt):
https://example1.com
https://example2.com
file1.docx
file2.pdf
  1. 运行以下命令进行批量处理:
while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt

环境变量配置

基础用法

设置自定义路径:

  • 设置 UV 路径:
export UV_PATH="/custom/path/to/uv"
  • 设置输出目录:
export MARKDOWN_OUTPUT_DIR="/output/path"

高级用法

在 Python 脚本中使用这些环境变量。

桌面应用集成

基础用法

配置 Node.js 环境:

node dist/index.js

高级用法

Python 脚本调用示例:

import subprocess

def convert_file(file_path):
subprocess.run(["python", "convert Utf8_py", file_path])

if __name__ == "__main__":
file_path = input("请输入文件路径:")
convert_file(file_path)

⚠️ 重要提示

  • 确保安装正确依赖,Node.js 和 Python 版本需满足要求。
  • 处理大文件时注意性能,处理大型 PDF 或 PPT 文件可能需要更多内存和时间。
  • 检查错误日志,遇到问题时,查看详细日志以快速定位。

🤝 贡献与反馈

欢迎提交 Pull Request 和 Issue!

感谢您的支持!希望这个项目能为您的工作带来便利。

  • 0 关注
  • 0 收藏,18 浏览
  • system 提出于 2025-09-28 21:45

相似服务问题

相关AI产品