这是一个简化版的模型上下文协议(MCP)服务器,借助聊天宝文本转语音(TTS)模型,它能够实现文本转语音功能,并自动播放生成的语音。服务器会在首次使用时自动加载模型,还能提供实时进度通知,让用户随时了解处理过程。
此MCP服务器通过一个简洁的工具,将聊天宝TTS的功能开放出来,实现从文本生成语音并自动播放。服务器能够无缝处理模型加载、进度报告、临时文件管理和音频播放等任务。
speak_textspeak_text 工具提供了完整的文本转语音功能:
参数:
text(必填):需要转换为语音的文本exaggeration(可选):控制语音表现力(范围为 0.0 - 1.0,默认值为 0.5)cfg_weight(可选):控制无分类器引导(范围为 0.0 - 1.0,默认值为 0.5)特性:
afplay 自动播放音频chatterbox://model-info获取 TTS 模型状态和设备能力的相关信息:
安装依赖项:
pip install mcp torch torchaudio
安装聊天宝 TTS:
按照聊天宝 TTS 的安装说明进行操作,确保 chatterbox.tts 模块可用。
独立运行:
python chatterbox_mcp_server.py
与 MCP 工具一起运行:
mcp dev chatterbox_mcp_server.py
添加到你的 Claude 桌面端 MCP 配置中:
基本配置:
{
"mcpServers": {
"chatterbox-tts": {
"command": "python",
"args": ["/path/to/chatterbox_mcp_server.py"],
"env": {}
}
}
}
自定义配置:
{
"mcpServers": {
"chatterbox-tts": {
"command": "python",
"args": [
"/path/to/chatterbox_mcp_server.py",
"--audio-dir", "/custom/audio/path",
"--auto-load-model",
"--audio-ttl-hours", "24"
],
"env": {
"CHATTERBOX_AUDIO_DIR": "/custom/audio/path",
"CHATTERBOX_AUDIO_TTL_HOURS": "24"
}
}
}
}
基本文本转语音:
请使用 speak_text 工具说出“你好,欢迎来到聊天宝 TTS 演示!”
富有表现力的语音:
使用 speak_text 工具为“这太棒了!”生成富有激情的语音
该工具将自动完成以下操作:
chatterbox-mcp/
├── chatterbox_mcp_server.py # MCP 服务器实现
└── README.md # 本说明文档
speak_text 工具,而非多个工具常见问题:
模型加载缓慢:
音频播放问题:
afplay 命令仅适用于 macOS 系统内存问题:
设备选择:
此 MCP 服务器的实现遵循底层聊天宝 TTS 模型的相同许可证。