语音 MCP 是一个支持语音交互的工具,提供文本转语音和语音转文本功能,支持多语言和多种语音引擎,能满足不同场景的语音交互需求。
使用语音 MCP 前,请确保系统及 Python 版本符合要求,然后按照安装步骤完成安装。安装完成后,可通过基本的命令启动并使用语音控制功能。
faster-whisper 引擎。pip install speech-mcp
brew install portaudio
export LDFLAGS="-L/usr/local/lib"
export CPPFLAGS="-I/usr/local/include"
pip install pyaudio
sudo apt-get update && sudo apt-get install portaudio19-dev python3-dev
pip install pyaudio
~/.config/speech-mcp/config.jsonSPEECH_MCP_TTS_VOICE:设置默认的文本转语音(TTS)引擎。SPEECH_MCP_STT_MODEL:设置默认的语音转文本(STT)模型。支持多种 TTS 引擎:
faster-whisper 引擎进行本地语音识别。speech-mcp start
faster-whisper 引擎进行语音识别。pyttsx3 或 Kokoro TTS 实现文本转语音功能。音频设备未检测到
PortAudio 安装失败
文中未提及项目的许可证信息,如需了解可进一步查阅项目相关资料。
详细更新记录请参考项目文档中的 变更日志。