Resemble

翻译官方认证 Python

🚀 使用Resemble AI的语音生成服务器

使用Resemble AI的语音生成服务器，可通过多种方式与您的项目进行连接，像与Cursor AI和Claude Desktop集成等。本项目能助力您轻松完成语音生成相关任务，提升项目的语音交互能力。

🚀 快速开始

您可以按照以下步骤，将Resemble AI的语音生成服务器集成到您的项目中。

📦 安装指南

创建虚拟环境（推荐）

为保证兼容性，建议为该项目创建一个独立的Python环境：

python -m venv mcp-venv
source mcp-venv/bin/activate  # 在Windows上使用 `mcp-venv\Scripts\activate`

安装依赖项

在激活的环境中安装所需的包：

pip install uvicorn fastapi python-dotenv requests pydantic httpx sse-starlette
pip install git+https://github.com/modelcontextprotocol/python-sdk.git

🔧 配置环境变量

复制并编辑示例环境文件

cp .env.example .env

添加Resemble AI API密钥

在.env文件中添加您的Resemble AI API密钥：

RESEMBLE_API_KEY=your_api_key_here

可选：自定义音频输出设置

OUTPUT_DIR=./output
AUDIO_FORMAT=mp3

创建输出目录

mkdir -p output

💻 运行服务器

使用新的CLI工具运行服务器，支持多种实现方式：

# 激活您的环境（如果尚未激活）
conda activate resemble-mcp
# 或者
source venv/bin/activate

# 使用MCP SDK实现（推荐）
python -m src.cli --implementation mcp --port 8083

# 其他实现：
# HTTP API实现
python -m src.cli --implementation http --port 8083
# 直接API实现
python -m src.cli --implementation direct --port 8083
# Resemble SDK实现
python -m src.cli --implementation sdk --port 8083

🛠️ 集成指南

集成到Cursor AI

在Cursor中，通过SSE接口与Resemble AI语音生成服务器交互：

打开Cursor的设置 -> AI -> MCP服务器。
点击“添加服务器”并输入SSE URL：http://localhost:8083/sse（根据需要调整端口）。

集成到Claude Desktop

在Claude Desktop中配置MCP服务器：编辑claudia.json文件，添加以下内容：

{
"mcpServers": {
"resemble-ai": {
"command": "python",
"args": ["-m", "src.cli", "--implementation", "mcp"],
"env": {
"RESEMBLE_API_KEY": "your_api_key_here"
},
"disabled": false,
"autoApprove": []
}
}
}

📚 工具文档

list_voices

列出Resemble AI的所有可用语音模型。

参数：无
返回：
- voices：包含语音模型ID、名称、性别、语言、口音和描述的列表。

generate_tts

从文本生成语音。

参数：
- text：要转换为语音的文本。
- voice_id：目标语音模型的ID（在list_voices中获取）。
- output_path：保存生成音频文件的路径。
返回：音频文件保存到指定路径。

💡 使用示例

生成语音

python -m src.cli generate-tts "This is a test." --voice_id your_voice_id --output_path output/audio.mp3

列出语音

python -m src.cli list-voices

⚠️ 注意事项

⚠️ 重要提示

Python版本要求：MCP包需要使用Python 3.10或更高版本。

API密钥安全：确保您的Resemble API密钥安全，避免泄露。

端口冲突：如果8083端口被占用，请尝试其他端口。

❓ 常见问题

问题1：如何获取语音ID？

使用list_voices命令获取可用的语音模型列表：

python -m src.cli list-voices

问题2：如何处理音频格式？

在.env文件中设置输出格式（如mp3或wav）。

🌟 结语

通过本文档，您可以轻松地将Resemble AI的语音生成服务器集成到项目中，并与Cursor AI和Claude Desktop无缝协作。

0 条评论
分类：翻译