OpenAI TTS

OpenAI TTS

🚀 tts-mcp 中文翻译

一个模型上下文协议(MCP)服务器和命令行工具,用于借助 OpenAI TTS API 实现高质量的文本转语音生成。

🚀 快速开始

本项目提供了一个模型上下文协议(MCP)服务器和命令行工具,可利用 OpenAI TTS API 进行高质量的文本转语音生成。以下为你介绍如何快速上手。

✨ 主要特性

  • MCP 服务器:可与 Claude Desktop 以及其他 MCP 兼容客户端集成文本转语音功能。
  • 语音选项:支持多种语音角色,如 alloy、nova、echo 等。
  • 高质量音频:支持多种输出格式,包括 MP3、WAV、OPUS、AAC 等。
  • 可配置性:能够对语速、语音角色和额外指令进行配置。
  • CLI 工具:可作为命令行工具直接使用,实现文本转语音转换。

📦 安装指南

方法 1:从仓库安装

# 克隆仓库
git clone https://github.com/nakamurau1/tts-mcp.git
cd tts-mcp

# 安装依赖项
npm install

# 可选:全局安装
npm install -g .

方法 2:使用 npx 直接运行(无需安装)

# 直接启动 MCP 服务器
npx tts-mcp tts-mcp-server --voice nova --model tts-1-hd

# 直接使用 CLI 工具
npx tts-mcp -t "Hello, world" -o hello.mp3

💻 使用示例

MCP 服务器用法

MCP 服务器允许您将文本转语音功能与模型上下文协议(MCP)兼容客户端集成。

安装依赖项

npm install openai@^6.25.0

启动服务器

node src/index.js

MCP 服务器选项

属性 详情
端口(--port) 服务监听的端口,默认为 3000
模型(--model) 使用的模型名称,默认为 "gpt-4o-mini-tts"
语音(--voice) 语音角色,默认为 "alloy"
语速(--speed) 语速(范围:0.25 - 4.0),默认为 1
格式(--format) 输出格式,默认为 "mp3"
指令(--instructions) 语音生成的额外指令
API 密钥(--api-key) OpenAI API 密钥(也可通过环境变量配置)

支持的语音角色

  • alloy(默认)
  • ash
  • coral
  • echo
  • fable
  • onyx
  • nova
  • sage
  • shimmer

支持的模型

  • tts-1
  • tts-1-hd
  • gpt-4o-mini-tts(默认)

输出格式

  • mp3(默认)
  • opus
  • aac
  • flac
  • wav
  • pcm

环境变量

您也可以通过系统环境变量配置工具:

export OPENAI_API_KEY=your-api-key-here

📄 许可证

本项目采用 MIT 许可证。

  • 0 关注
  • 0 收藏,37 浏览
  • system 提出于 2025-10-07 09:21

相似服务问题

相关AI产品