🚀 语音 MCP 介绍
语音 MCP 是一款强大的语音交互处理工具,具备多种功能模块,能高效实现语音与文字的转换,支持多语言交互,为用户带来优质的语音体验。
🚀 快速开始
语音 MCP 支持语音转文字、文字转语音、语音对话等多种功能,还能支持多种语言,实现高质量语音合成,为用户提供便捷的语音交互体验。
✨ 主要特性
- 语音转文字(STT)
- 文字转语音(TTS)
- 语音对话模式
- 多种语言支持
- 高质量语音合成
- 本地运行模式
- 多设备支持
- 自定义语音设置
- 故障排除工具
📦 安装指南
安装语音 MCP 的步骤如下:
- 下载源码包
- 解压文件
- 执行安装脚本
- 完成配置
安装依赖项
需要安装以下库:
- pyaudio
- numpy
- scipy
- whisper
- pyttsx3
- PyQt5
📚 详细文档
配置参数
用户配置文件位于:~/.config/speech-mcp/config.json
包含设置包括:
- 默认 TTS 引擎
- 选中语音模型
- 语言代码
- 界面主题
故障排除
常见问题及解决方案:
- 检查系统日志
- 重置组件状态
- 使用直接命令运行
- 验证音频设备配置
- 安装 PortAudio 依赖
Changelog
更新记录请参考文档中的 CHANGELOG.md 文件。
🔧 技术细节
核心组件:
- 基于 faster-whisper 的语音识别引擎
- 支持 pyttsx3 和 Kokoro TTS 引擎
- 内置 54+ 高质量语音模型
- 现代 Dark 主题 UI
- 动态音频可视化
📄 许可证
该工具采用 MIT 许可证,具体内容见 LICENSE 文件。