VoiceChanger
基于SoundTouch语音变声库,实现男声变女声,女声变男生,机器音,tom猫音等
Install / Use
/learn @yangningbo/VoiceChangerREADME
VoiceChanger
基于SoundTouch语音变声库,实现男声变女声,女声变男生,机器音,tom猫音等。
public enum VoiceType {
VT_NONE, VT_KITTY, VT_ROSE, VT_UNCLE, VT_TOM
}
SoundTouch变声算法概述
SoundTouch变声算法基于音频处理技术,通过调整音频信号中的频率和时序,实现对声音的变声效果。其主要功能包括:
- 变速处理:改变音频的播放速度,而不改变其音调。
- 变调处理:改变音频的音调,而不改变其播放速度。
- 变速变调处理:同时改变音频的播放速度和音调。
SoundTouch变声算法原理
SoundTouch变声算法主要包含以下步骤:
- 音频采样:将音频信号转换为数字信号,并采样成固定频率的音频样本。
- 音频处理:对音频样本进行时序调整和频率调整。
- 时序调整:通过改变音频样本的播放顺序,实现变速效果。
- 频率调整:通过改变音频样本的频率,实现变调效果。
- 音频合成:将处理后的音频样本重新合成,生成变声效果。
实现SoundTouch变声算法的关键技术
- 快速傅里叶变换(FFT):用于将音频信号从时域转换为频域,便于进行频率调整。
- 逆快速傅里叶变换(IFFT):用于将处理后的音频样本从频域转换回时域,生成变声效果。
- 窗函数:用于改善FFT和IFFT的计算精度。
- 相位保持:在变声过程中,保持音频信号的相位,确保变声效果的自然度。
SoundTouch变声算法的应用
- 娱乐领域:游戏配音、电影配音、网络语音聊天等。
- 教育领域:语言教学、语音训练等。
- 商业领域:广告配音、客服语音合成等。
SoundTouch变声算法的优势
- 开源免费:SoundTouch是一款开源的音频处理库,用户可以免费使用。
- 性能优越:SoundTouch算法在处理音频信号时,具有较高的计算精度和实时性。
- 功能丰富:SoundTouch支持多种变声效果,满足不同用户的需求。
采样:
setChannels(int) 设置声道,1 = mono单声道, 2 = stereo立体声 setSampleRate(uint) 设置采样率
速率:
setRate(double) 指定播放速率,原始值为1.0,大快小慢 setTempo(double) 指定节拍,原始值为1.0,大快小慢 setRateChange(double)、setTempoChange(double) 在原速1.0基础上,按百分比做增量,取值(-50 .. +100 %)
音调:
setPitch(double) 指定音调值,原始值为1.0 setPitchOctaves(double) 在原音调基础上以八度音为单位进行调整,取值为[-1.00,+1.00] setPitchSemiTones(int) 在原音调基础上以半音为单位进行调整,取值为[-12,+12]
Related Skills
node-connect
337.7kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
83.3kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
337.7kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
commit-push-pr
83.3kCommit, push, and open a PR
