DH 라이브: 30/40 시리즈 그래픽 카드에서 원활한 실시간 상호작용을 위한 AI 디지털 휴먼

최신 AI 도구8 개월 전에 게시 됨 Sharenet.ai
1.4K 0
吐司AI

일반 소개

DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可以通过简单的步骤创建和使用数字人,实现音频驱动的视频生成和实时互动。

 

기능 목록

  • 实时性能:支持 NVIDIA 30 和 40 系列显卡,提供流畅的实时互动体验。
  • few-shot 学习:系统能够从少量示例中学习,生成逼真的响应。
  • 视频准备:使用 data_preparation 脚本准备视频数据。
  • 音频驱动:支持通过音频文件驱动数字人,生成同步视频。
  • 实时麦克风输入:支持通过麦克风进行实时操作。

 

도움말 사용

环境创建与模型文件解压

  1. 创建虚拟环境并激活:
    conda create -n dh_live python=3.12
    conda activate dh_live
    
  2. 종속성을 설치합니다:
    pip install torch --index-url https://download.pytorch.org/whl/cu124
    pip install -r requirements.txt
    
  3. 解压模型文件:
    • Linux:
      cd checkpoint
      cat render.pth.gz.001 render.pth.gz.002 > render.pth.gz
      gzip -d -c render.pth.gz > render.pth
      
    • Windows: 使用 7zip 或 WinRAR 解压 checkpoint 文件。

视频准备

  1. 활용 data_preparation.py 脚本准备视频:
    python data_preparation.py YOUR_VIDEO_PATH
    

    结果将存储在 ./video_data 카탈로그.

使用音频文件运行

  1. 确保音频文件为 .wav 格式,采样率为 16kHz,16 位单声道。
  2. 运行 demo 脚本:
    python demo.py video_data/test video_data/audio0.wav 1.mp4
    

实时运行

  1. 使用麦克风进行实时操作:
    python demo_avatar.py
    

일반적인 문제

  • 模型文件解压失败:请确保所有分卷文件完整并正确解压。
  • 音频文件格式不正确:请使用符合要求的 .wav 文件。

 

DH live 一键安装包

链接:https://pan.quark.cn/s/5a34bc9c2f76
提取码:sZT4

© 저작권 정책
AiPPT

관련 문서

댓글 없음

없음
댓글 없음...