使用Resemble AI的语音生成服务器,可通过多种方式与您的项目进行连接,像与Cursor AI和Claude Desktop集成等。本项目能助力您轻松完成语音生成相关任务,提升项目的语音交互能力。
您可以按照以下步骤,将Resemble AI的语音生成服务器集成到您的项目中。
为保证兼容性,建议为该项目创建一个独立的Python环境:
python -m venv mcp-venv
source mcp-venv/bin/activate # 在Windows上使用 `mcp-venv\Scripts\activate`
在激活的环境中安装所需的包:
pip install uvicorn fastapi python-dotenv requests pydantic httpx sse-starlette
pip install git+https://github.com/modelcontextprotocol/python-sdk.git
cp .env.example .env
在.env文件中添加您的Resemble AI API密钥:
RESEMBLE_API_KEY=your_api_key_here
OUTPUT_DIR=./output
AUDIO_FORMAT=mp3
mkdir -p output
使用新的CLI工具运行服务器,支持多种实现方式:
# 激活您的环境(如果尚未激活)
conda activate resemble-mcp
# 或者
source venv/bin/activate
# 使用MCP SDK实现(推荐)
python -m src.cli --implementation mcp --port 8083
# 其他实现:
# HTTP API实现
python -m src.cli --implementation http --port 8083
# 直接API实现
python -m src.cli --implementation direct --port 8083
# Resemble SDK实现
python -m src.cli --implementation sdk --port 8083
在Cursor中,通过SSE接口与Resemble AI语音生成服务器交互:
http://localhost:8083/sse(根据需要调整端口)。在Claude Desktop中配置MCP服务器:
编辑claudia.json文件,添加以下内容:
{
"mcpServers": {
"resemble-ai": {
"command": "python",
"args": ["-m", "src.cli", "--implementation", "mcp"],
"env": {
"RESEMBLE_API_KEY": "your_api_key_here"
},
"disabled": false,
"autoApprove": []
}
}
}
列出Resemble AI的所有可用语音模型。
voices:包含语音模型ID、名称、性别、语言、口音和描述的列表。从文本生成语音。
text:要转换为语音的文本。voice_id:目标语音模型的ID(在list_voices中获取)。output_path:保存生成音频文件的路径。python -m src.cli generate-tts "This is a test." --voice_id your_voice_id --output_path output/audio.mp3
python -m src.cli list-voices
⚠️ 重要提示
- Python版本要求:MCP包需要使用Python 3.10或更高版本。
- API密钥安全:确保您的Resemble API密钥安全,避免泄露。
- 端口冲突:如果8083端口被占用,请尝试其他端口。
使用list_voices命令获取可用的语音模型列表:
python -m src.cli list-voices
在.env文件中设置输出格式(如mp3或wav)。
通过本文档,您可以轻松地将Resemble AI的语音生成服务器集成到项目中,并与Cursor AI和Claude Desktop无缝协作。