语音呼叫 MCP 服务器是一个模型上下文协议(MCP)服务器,它能让 Claude 和其他人工智能助手借助 Twilio 和 OpenAI(GPT - 4o 实时模型)发起并管理语音电话。借助该服务器,你可以快速开启 AI 驱动语音通话的探索之旅,节省时间并在此基础上开发更多功能。
本项目可帮助你快速开启 AI 驱动语音通话的探索,你可以基于此项目节省时间并开发更多功能。
sequenceDiagram
participant AI as AI Assistant (e.g., Claude)
participant MCP as MCP Server
participant Twilio as Twilio
participant Phone as Destination Phone
participant OpenAI as OpenAI
AI->>MCP: 1) 发起外呼请求(POST /calls)
MCP->>Twilio: 2) 通过Twilio API放置外呼
Twilio->>Phone: 3) 拨打目标电话
Twilio->>MCP: 4) 呼叫状态更新及音频回调(webhooks)
MCP->>OpenAI: 5) 将实时音频转发到OpenaAI的实时模型
OpenAI->>MCP: 6) 返回语音流
MCP->>Twilio: 7) 发送语音流
Twilio->>Phone: 8) 转发语音流
Note over Phone: 双向对话继续进行
直到通话结束
⚠️ 重要提示
- 电话号码格式:所有电话号码必须为 E.164 格式(例如,+11234567890)
- 速率限制:注意 Twilio 和 OpenAI 账户的速率限制和定价
- 语音对话:人工智能将实时处理自然对话
- 呼叫时长:注意呼叫时长,因为它们会影响 OpenAI API 和 Twilio 费用
- 公开暴露:ngrok 隧道会公开暴露您的服务器(尽管带有随机 URL 并受随机密钥保护)
常见错误消息及解决方案:
欢迎贡献!以下是希望改进的领域:
如果您希望贡献,请在提交拉取请求之前打开问题讨论您的想法。
⚠️ 重要提示
请勿在 GitHub 问题或拉取请求中包含任何敏感信息(如电话号码或 API 凭证)。此服务器处理敏感通信;负责任地部署,并确保所有凭证安全。
该项目根据 MIT 许可证授权 - 有关详细信息,请参阅 LICENSE 文件。