MCP 视频转录工具是一款强大的视频处理软件,它能从 YouTube 等平台下载视频,并将视频音频转换为文字。借助多种先进语音识别技术,可帮助用户快速完成视频转录任务。
你可以按照以下步骤启动并使用 MCP 视频转录工具:
git clone https://github.com/your-username/MCP-Video.git
cd MCP-Video
uv pip install -r requirements.txt
config.env 文件,并填写以下内容:DEEPGRAM_API_KEY=your_key_here
GLADIA_API_KEY=your_key_here
ASSEMBLYAI_API_KEY=your_key_here
SPEECHMATICS_API_KEY=your_key_here
# config.py
SERVICE_PRIORITY = [
'Deepgram',
'Gladia',
'AssemblyAI',
'Speechmatics'
]
uv run main.py
from mcp_video import MCPVideoProcessor
processor = MCPVideoProcessor()
# 下载视频
video_path = processor.download_video('https://www.youtube.com/watch?v=12345')
# 提取音频
audio_path = processor.extract_audio(video_path)
# 转录音频
transcript = processor.transcribe(audio_path)
print(transcript.text)
git clone https://github.com/your-username/MCP-Video.git
cd MCP-Video
uv pip install -r requirements.txt
from mcp_video import MCPVideoProcessor
processor = MCPVideoProcessor()
# 下载视频
video_path = processor.download_video('https://www.youtube.com/watch?v=12345')
# 提取音频
audio_path = processor.extract_audio(video_path)
# 转录音频
transcript = processor.transcribe(audio_path)
print(transcript.text)
MCP-Video/
├── src/
│ ├── services/
│ │ ├── download/ # 下载模块
│ │ │ └── __init__.py
│ │ └── transcription/ # 转录模块
│ │ └── __init__.py
├── tests/
│ ├── test_env.py # 环境测试
│ ├── test_downloader.py # 下载器测试
│ └── test_transcription.py # 转录器测试
└── requirements.txt # 依赖管理文件
请在项目根目录下创建 config.env 文件,并填写以下内容:
DEEPGRAM_API_KEY=your_key_here
GLADIA_API_KEY=your_key_here
ASSEMBLYAI_API_KEY=your_key_here
SPEECHMATICS_API_KEY=your_key_here
# config.py
SERVICE_PRIORITY = [
'Deepgram',
'Gladia',
'AssemblyAI',
'Speechmatics'
]
uv test
在 src/services/transcription/ 目录下创建新类,继承自 BaseTranscriptionService 并实现 transcribe 方法。
在 src/services/download/ 目录下扩展或修改现有下载器,建议参考 YouTubeDownloader 类。
uv pip install package_name 安装新依赖。uv pip freeze > requirements.txt 导出当前依赖。服务内置了完善的错误处理机制,能够自动处理以下问题:
⚠️ 重要提示
- 确保系统磁盘空间充足以支持临时文件存储。
- 建议使用 Python 3.11 或更高版本。
- YouTube 下载可能需要额外的身份验证配置。
- 合理管理 API 调用次数,避免触发速率限制。
| 服务名称 | 免费额度 |
|---|---|
| Speechmatics | 每月免费时长 8 小时 |
| Gladia | 每月免费时长 10 小时 |
| AssemblyAI | 免费额度 $50/月 |
| Deepgram | 免费额度 $200/月 |
本项目遵循 MIT 开源协议,详见 LICENSE 文件。