Speech Interface (Faster Whisper)

Speech Interface (Faster Whisper)

🚀 语音 MCP 介绍

语音 MCP 是一款强大的语音交互处理工具,具备多种功能模块,能高效实现语音与文字的转换,支持多语言交互,为用户带来优质的语音体验。

🚀 快速开始

语音 MCP 支持语音转文字、文字转语音、语音对话等多种功能,还能支持多种语言,实现高质量语音合成,为用户提供便捷的语音交互体验。

✨ 主要特性

  • 语音转文字(STT)
  • 文字转语音(TTS)
  • 语音对话模式
  • 多种语言支持
  • 高质量语音合成
  • 本地运行模式
  • 多设备支持
  • 自定义语音设置
  • 故障排除工具

📦 安装指南

安装语音 MCP 的步骤如下:

  1. 下载源码包
  2. 解压文件
  3. 执行安装脚本
  4. 完成配置

安装依赖项

需要安装以下库:

  • pyaudio
  • numpy
  • scipy
  • whisper
  • pyttsx3
  • PyQt5

📚 详细文档

配置参数

用户配置文件位于:~/.config/speech-mcp/config.json 包含设置包括:

  • 默认 TTS 引擎
  • 选中语音模型
  • 语言代码
  • 界面主题

故障排除

常见问题及解决方案:

  • 检查系统日志
  • 重置组件状态
  • 使用直接命令运行
  • 验证音频设备配置
  • 安装 PortAudio 依赖

Changelog

更新记录请参考文档中的 CHANGELOG.md 文件。

🔧 技术细节

核心组件:

  • 基于 faster-whisper 的语音识别引擎
  • 支持 pyttsx3 和 Kokoro TTS 引擎
  • 内置 54+ 高质量语音模型
  • 现代 Dark 主题 UI
  • 动态音频可视化

📄 许可证

该工具采用 MIT 许可证,具体内容见 LICENSE 文件。

  • 0 关注
  • 0 收藏,26 浏览
  • system 提出于 2025-10-03 06:39

相似服务问题

相关AI产品