Voice Recorder Mcp Server

Voice Recorder Mcp Server

🚀 语音录音 MCP 服务器

本项目是一个使用 OpenAI 的 Whisper 模型进行音频记录并转录文字的 MCP 服务器,既可以作为 Goose 自定义扩展运行,也能作为独立的 MCP 服务器使用,为音频转录提供了便捷的解决方案。

✨ 主要特性

  • 可从默认麦克风录制音频。
  • 运用 Whisper 模型对录制的音频进行转录。
  • 能够集成到 Goose AI 代理中,作为自定义扩展使用。
  • 提供常见录音场景的提示语,方便用户操作。

📦 安装指南

# 从源代码安装
git clone https://github.com/DefiBax/voice-recorder-mcp.git
cd voice-recorder-mcp
pip install -e .

💻 使用示例

基础用法

作为独立 MCP 服务器运行

# 使用默认设置运行(base.en 模型)
voice-recorder-mcp

# 使用指定的 Whisper 模型
voice-recorder-mcp --model medium.en

# 调整采样率
voice-recorder-mcp --sample-rate 44100

使用 MCP 监视器测试

MCP 监视器提供交互式界面用于测试服务器:

# 安装 MCP 监视器
npm install -g @modelcontextprotocol/inspector

# 使用监视器运行你的服务器
npx @modelcontextprotocol/inspector voice-recorder-mcp

与 Goose AI 代理配合使用

  1. 打开 Goose,进入设置 > 扩展 > 添加 > 命令行扩展。

  2. 设置名称为 voice-recorder

  3. 在命令字段中输入语音录音器 MCP 可执行文件的完整路径:

    /full/path/to/voice-recorder-mcp
    

    或指定模型运行:

    /full/path/to/voice-recorder-mcp --model medium.en
    

    查找路径方法:

    which voice-recorder-mcp
    
  4. 基本功能无需额外环境变量配置。

  5. 在与 Goose 的对话中,通过以下语句介绍录音器: "我希望你可以从语音录音器返回的转录文字中采取行动。例如,当我口述计算如 1+1 时,请返回结果。"

高级用法

本项目提供了一些可用工具,方便用户进行音频录制和转录操作:

  • start_recording:开始从默认麦克风录制音频。
  • stop_and_transcribe:停止录音并转录为文字。
  • record_and_transcribe:按指定时长录音并转录(秒)。

📚 详细文档

Whisper 模型

此扩展支持多种 Whisper 模型大小,具体信息如下:

模型 速度 准确度 内存占用 使用场景
tiny.en 最快 最低 最小 测试、快速转录
base.en 快速 较好 较低 日常使用(默认)
small.en 中等 更佳 中等 平衡性能
medium.en 较高 重要录音
large 最慢 最高 关键转录

.en 后缀表示该模型专为英语优化,对于英语内容更快且更准确。

配置要求

  • Python 3.12+
  • 带音频输入设备(麦克风)

配置选项

你可以通过环境变量配置服务器:

# 设置 Whisper 模型
export WHISPER_MODEL=small.en

# 设置音频采样率
export SAMPLE_RATE=44100

# 设置最大录音时长(秒)
export MAX_DURATION=120

# 使用以下命令运行服务器:
voice-recorder-mcp

⚠️ 注意事项

⚠️ 重要提示

  • 确保麦克风权限已正确设置,以便应用程序可以访问。
  • 对于网络连接,请确保设备具备稳定的互联网以支持模型推理。
  • 在使用过程中如遇问题,请检查控制台输出或查阅相关文档。

🤝 贡献指南

欢迎社区贡献!请参考项目仓库中的Contributing.md了解如何参与开发。

  • 0 关注
  • 0 收藏,24 浏览
  • system 提出于 2025-10-02 03:45

相似服务问题

相关AI产品