TransRouter
Trans Router
Install / Use
/learn @notedit/TransRouterREADME
TransRouter
TransRouter 是一个实时语音翻译工具,使用 Google Gemini 大模型进行中英文实时翻译。它可以直接与 Zoom 等会议软件集成,实现实时的语音翻译。
功能特点
- 实时语音翻译
- 中=》英翻译
- 自动语音合成
- 与 Zoom 等会议软件无缝集成
- 低延迟的流式处理
系统要求
- Python 3.8 或更高版本
- macOS 系统
- BlackHole 虚拟音频设备(用于音频路由)
- 稳定的网络连接
- Google Gemini API 密钥
安装步骤
- 克隆仓库:
git clone https://github.com/notedit/TransRouter.git
cd TransRouter
- 创建并激活虚拟环境:
Mac:
python -m venv venv
./venv/bin/activate
- 安装依赖:
pip install -r requirements.txt
- 配置环境变量:
- 复制
.env.example为.env - 填入您的 API 密钥:
- 复制
GOOGLE_API_KEY=your_gemini_api_key
音频设备配置
macOS
- 安装 BlackHole:
brew install blackhole-2ch
- 系统设置:
- 打开系统偏好设置 > 声音
- 确认可以看到 BlackHole 2ch 设备
Zoom 配置
- 打开 Zoom 设置 > 音频
- 麦克风:选择系统默认麦克风
- 扬声器:选择 "BlackHole 2ch"
使用说明
- 查看可用设备:
python main.py --list-devices
- 基本使用
python main.py
- 指定输入输出设备
python main.py --input-device "输入设备名称" --output-device "输出设备名称"
- 使用 BlackHole 作为输出设备:
python main.py --blackhole
技术实现
- 音频采集:使用 sounddevice 进行实时音频采集
- 语音翻译:使用 Google Gemini 大模型进行音频翻译
- 音频输出:使用异步音频流实现低延迟播放
常见问题
-
找不到音频设备:
- 检查 BlackHole 是否正确安装
- 运行程序时查看打印的设备列表
- 确认系统音频设置中可以看到虚拟设备
-
翻译延迟:
- 检查网络连接
- 可能是 API 调用限制
- 检查音频队列长度
-
音频问题:
- 确认采样率设置(输入16kHz,输出24kHz)
- 检查音频设备路由
- 验证 Zoom 音频设置
注意事项
-
API 使用:
- 注意 API 调用限制和计费
- 保护好 API 密钥
-
音频设置:
- 输入采样率 16kHz
- 输出采样率 24kHz
- 单声道音频
- PCM 16bit 格式
-
系统要求:
- 确保 Python 环境正确
- 安装必要的音频驱动
- 保持充足的系统资源
Related Skills
node-connect
351.2kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
110.6kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
351.2kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
qqbot-media
351.2kQQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
