Xvads
eXtended Voice Activity Detection Splitter
Install / Use
/learn @sogouspeech/XvadsREADME
xvads
相关说明
eXtended Voice Activity Detection Splitter
非常简单的音频切片调用小工具,用于知音平台相关演示目的。 调用方法类似 xargs,不同的是 xargs 切割文本;xvads 切割音频
- 使用 WebRTC 的 VAD 模块做音频切片
- WebRTC VAD 的C代码复制自 py-webrtcvad
- Go 部分代码和相关封装方法来自 go-webrtcvad
构建方法
- 安装 golang 1.13 以上版本
- 较新版本的 gcc
go install ./cmd/...
使用方法
下面是一个示例:
- 用 fmedia 工具抓取默认输入设备的音轨(单声道 16KHZ 16Bit 采样率)并通过管道发送给 xvads
- xvads 将有效音频切割出来并实时调用子命令,将分片音频作为子命令的标准输入
fmedia --record --out=@stdout.wav --format=int16 --channels=mono --rate=16000 2>/dev/null | xvads sub-command arguments-of-subcommand ...
Related Skills
node-connect
347.9kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
108.7kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
347.9kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
qqbot-media
347.9kQQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
