검색 기반 음성 변환 웹UI: 검색 기반 음성 변환을 위한 프레임워크 | 실제 노래하는 목소리 시뮬레이션하기
일반 소개
Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点,支持N卡、A卡、I卡的加速,提供网页界面和实时变声界面,还可以调用UVR5模型来快速分离人声和伴奏,使用最先进的人声音高提取算法RMVPE来根绝哑音问题。
底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。

训练推理界面

实时变声界面
기능 목록
- 训练自己的语音转换模型,只需10分钟的语音数据即可
- 使用预训练的语音转换模型,支持多种采样率和音色
- 使用网页界面或实时变声界面进行语音转换,支持端到端的低延迟
- 使用UVR5模型来分离人声和伴奏,支持多种格式的音频文件
- 使用RMVPE算法来提取人声音高,支持pytorch/onnx/DirectML
도움말 사용
- 下载或克隆本仓库,安装所需的依赖和预模型
- 运行go-web.bat或go-realtime-gui.bat,选择想要执行的操作
- 根据界面提示,选择输入和输出的语音文件或设备,调整参数和选项
- 点击开始或停止,享受语音转换的乐趣
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...