鱼语-MCP是一个专门为大型语言模型(LLM)打造的文本到语音合成(TTS)的MCP服务器,能够高效地将文本转化为语音,为LLM提供出色的语音交互能力。
鱼语-MCP服务器可与Dive和其他MCP兼容的LLM一同使用,借助FishSpeech实现文本到语音的转换。您可以按照以下步骤进行安装和配置。
{
"mcpServers": {
"fish-speech": {
"command": "npx",
"args": [
"-y",
"@demon24ru/fish-speech-mcp"
]
}
}
}
MCP服务器可以通过环境变量进行灵活配置:
| 属性 | 详情 |
|---|---|
MCP_FISH_SPEECH_SERVER_URL |
Optivus服务器的URL(默认:http://localhost:5000) |
text (字符串,必需):要转换为语音的文本。reference_id (字符串,可选):保存语音的标识符。reference_audio (字符串,必需):用于语音克隆的音频文件路径。reference_text (字符串,必需):与音频文件对应的文本。MCP服务器通过Socket.IO与Optivus服务器进行通信,具体流程如下:
message事件发送到服务器。message事件从服务器接收。语音参考存储在optivus目录中,每个参考保存在一个具有唯一ID的子目录中。
让您的LLM执行以下操作:
"将此文本转换为语音:要转换的文本,参考标识符"
"保存语音参考:音频文件路径,与音频文件对应的文本"
如果需要,可手动启动服务器,执行以下命令:
npx @demon24ru/fish-speech-mcp
若需要在调试模式下启动服务器,可执行以下命令:
npm run prepare
npx @modelcontextprotocol/inspector node ./lib/index.mjs -y
本项目采用MIT许可证。
@demon24ru