간편한 음성 툴킷: 로컬 배포를 위한 AI 음성 툴킷

최신 AI 도구9개월 전 업데이트 Sharenet.ai
1.3K 0
Trae

일반 소개

Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具,或按顺序使用它们,将原始音频文件逐步转换为理想的语音模型。该工具箱支持本地部署,用户可以下载轻量级安装包或便携式包进行使用。

 

Easy Voice Toolkit:本地部署的AI语音工具箱

 

 

기능 목록

  • 오디오 처리
Easy Voice Toolkit:本地部署的AI语音工具箱

 

  • 음성 인식
Easy Voice Toolkit:本地部署的AI语音工具箱

 

  • 语音转录
Easy Voice Toolkit:本地部署的AI语音工具箱

 

  • 数据集制作(SRT 转换 & WAV 分割)
Easy Voice Toolkit:本地部署的AI语音工具箱

 

  • 모델 교육
Easy Voice Toolkit:本地部署的AI语音工具箱

 

  • 음성 합성
Easy Voice Toolkit:本地部署的AI语音工具箱

 

도움말 사용

安装流程:

  1. 下载轻量安装包:小型包,包含安装说明,但不包含必要的环境依赖和模型。
  2. 下载即用型便携包:大型包,包含所有环境依赖和多个模型预设,下载后解压即可使用。

本地部署 - 用户安装:

  1. 下载轻量安装包或即用型便携包。
  2. 解压缩下载的文件。
  3. 움직여야 합니다. .exe 文件或其快捷方式。

本地部署 - 开发者设置环境:

  1. 确保已安装 Python 3.8 或更高版本。
  2. 克隆项目仓库:
    git clone https://github.com/Spr-Aachen/Easy-Voice-Toolkit.git
    
  3. 切换到项目目录:
    cd Easy-Voice-Toolkit
    
  4. 安装依赖项:
    pip install -r requirements.txt
    
  5. 安装 GUI 依赖项:
    pip install pyside6 QEasyWidgets pywin32==300 psutil pynvml darkdetect PyGithub
    
  6. 运行程序:
    python Run.py
    

功能操作流程:

  1. 오디오 처리:导入音频文件,选择所需的处理工具(如降噪、剪辑等),应用处理并保存结果。
  2. 음성 인식:导入音频文件,选择语音识别模型,运行识别并导出文本结果。
  3. 语音转录:导入音频文件,选择转录工具,运行转录并导出字幕文件(如 SRT)。
  4. 数据集制作:导入音频文件,选择数据集制作工具,进行 SRT 转换或 WAV 分割,生成训练数据集。
  5. 모델 교육:导入训练数据集,选择模型训练工具,配置训练参数,运行训练并保存模型。
  6. 음성 전사:导入音频文件,选择语音转换工具,配置转换参数,运行转换并保存结果。

주의

  • 目前 UI 界面仅支持 Windows 系统。
  • 下载和使用过程中请确保网络连接稳定。
  • 如果遇到问题,请参考项目仓库中的使用说明和常见问题解答。
© 저작권 정책
AiPPT

관련 문서

댓글 없음

없음
댓글 없음...