语音 MCP 服务器基于 Model Context Protocol (MCP) 打造,借助 Kokoro TTS 模型,为你提供出色的文本到语音转换功能。
npm install -g @decodershq/speech-mcp-server
npm start
在启动服务器前,你可以通过设置环境变量来定制服务器的行为:
| 变量 | 描述 | 默认值 | 有效范围 |
|---|---|---|---|
MCP_DEFAULT_SPEECH_SPEED |
文本到语音的默认速度倍数 | 1.1 | 0.5 到 2.0 |
MCP_DEFAULT_VOICE |
文本到语音的默认音调 | af_bella | 任何有效的音调 ID |
启动服务器后,你可以使用以下命令调用不同的工具:
echo '{"type":"request","method":"call_tool","params":{"name":"text_to_speech","arguments":{"text":"Hello world","voice":"af_bella"}}}' | node dist/index.js
echo '{"type":"request","method":"list_voices","params":{}}' | node dist/index.js
echo '{"type":"request","method":"get_model_status","params":{}}' | node dist/index.js
在 Cursor 里,你可以通过以下配置来使用该服务器:
{
"mcpServers": {
"speech": {
"command": "npx",
"args": [
"-y",
"speech-mcp-server"
],
"env": {
"MCP_DEFAULT_SPEECH_SPEED": 1.3,
"MCP_DEFAULT_VOICE": "af_bella"
}
}
}
}
若要在 Claude Desktop 中使用此服务器,请在 ~/Library/Application Support/Claude/claude_desktop_config.json 文件中添加以下内容:
{
"servers": {
"speech": {
"command": "npx",
"args": ["@decodershq/speech-mcp-server"]
}
}
}
服务器可以通过环境变量进行配置,你可以根据自己的需求调整语音速度和音调。在 Cursor 或 Claude Desktop 中,你可以通过特定的配置来使用该服务器。同时,服务器具备故障恢复机制,当模型初始化失败时,会自动重试并清理旧文件。
本项目采用 MIT 许可证,详细信息请参阅 LICENSE 文件。
如果遇到模型初始化失败的情况,你可以按照以下步骤进行处理:
get_model_status 工具监控初始化进度和错误信息。# 删除模型文件(MacOS/Linux)
rm -rf ~/.npm/_npx/**/node_modules/@huggingface/transformers/.cache/onnx-community/Kokoro-82M-v1.0-ONNX/onnx/model_quantized.onnx
rm -rf ~/.cache/huggingface/transformers/onnx-community/Kokoro-82M-v1.0-ONNX/onnx/model_quantized.onnx
# 然后重启服务器
npm start
get_model_status 工具的响应将包含重试信息:
{
"content": [{
"type": "text",
"text": "模型状态:正在初始化(5 秒已用,重试 1/3)"
}]
}