DH 라이브: 30/40 시리즈 그래픽 카드에서 원활한 실시간 상호작용을 위한 AI 디지털 휴먼

1.4K 0

일반 소개

DH_live 是一个基于少样本学习的实时直播数字人项目，旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡，能够以 25+ fps 的速度实时运行。用户可以通过简单的步骤创建和使用数字人，实现音频驱动的视频生成和实时互动。

기능 목록

实时性能：支持 NVIDIA 30 和 40 系列显卡，提供流畅的实时互动体验。
few-shot 学习：系统能够从少量示例中学习，生成逼真的响应。
视频准备：使用 data_preparation 脚本准备视频数据。
音频驱动：支持通过音频文件驱动数字人，生成同步视频。
实时麦克风输入：支持通过麦克风进行实时操作。

도움말 사용

环境创建与模型文件解压

创建虚拟环境并激活：

conda create -n dh_live python=3.12
conda activate dh_live

종속성을 설치합니다:

pip install torch --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

解压模型文件：

Linux:

cd checkpoint
cat render.pth.gz.001 render.pth.gz.002 > render.pth.gz
gzip -d -c render.pth.gz > render.pth

Windows: 使用 7zip 或 WinRAR 解压 checkpoint 文件。

视频准备

활용 data_preparation.py 脚本准备视频：
```
python data_preparation.py YOUR_VIDEO_PATH
```
结果将存储在 ./video_data 카탈로그.

使用音频文件运行

确保音频文件为 .wav 格式，采样率为 16kHz，16 位单声道。

运行 demo 脚本：

python demo.py video_data/test video_data/audio0.wav 1.mp4

实时运行

使用麦克风进行实时操作：
```
python demo_avatar.py
```

일반적인 문제

模型文件解压失败：请确保所有分卷文件完整并正确解压。
音频文件格式不正确：请使用符合要求的 .wav 文件。

DH live 一键安装包

链接：https://pan.quark.cn/s/5a34bc9c2f76
提取码：sZT4

최신 AI 도구 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.

Coding Agent：基于Langgraph构建的简单编程助手

최신 AI 도구 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

6개월 전

01.1K

Firebase Studio: 풀스택 애플리케이션을 신속하게 구축하고 배포하는 AI의 클라우드 도구

최신 AI 도구 # AI IDE # AI 프로그래밍

3 개월 전

0603

MediaCrawler：多社交媒体平台内容、视频评论爬虫工具

최신 AI 도구 # AI 자바 오픈 소스 프로젝트

11개월 전

01.4K

WPS 마스터 마인드: 지능형 생성, 문서 생성 및 데이터 분석 도구, 포괄적인 지능형 오피스 도우미

6개월 전

01.3K

댓글 없음

댓글 없음...

DH 라이브: 30/40 시리즈 그래픽 카드에서 원활한 실시간 상호작용을 위한 AI 디지털 휴먼

일반 소개

기능 목록

도움말 사용

环境创建与模型文件解压

视频准备

使用音频文件运行

实时运行

일반적인 문제

DH live 一键安装包

CatVTON-FLUX: 가상 피팅 체계를 위한 CATVTON과 플럭스 충전 수리 모델의 결합

Galaxy.ai: 시중의 모든 유형의 제너레이티브 AI 도구를 이해하기 위한 1700개 이상의 AI 도구 라이브러리를 통합하는 다기능 플랫폼(유료)

관련 문서

Coding Agent：基于Langgraph构建的简单编程助手

Firebase Studio: 풀스택 애플리케이션을 신속하게 구축하고 배포하는 AI의 클라우드 도구

MediaCrawler：多社交媒体平台内容、视频评论爬虫工具

WPS 마스터 마인드: 지능형 생성, 문서 생성 및 데이터 분석 도구, 포괄적인 지능형 오피스 도우미

댓글 없음

최신 기사

DH 라이브: 30/40 시리즈 그래픽 카드에서 원활한 실시간 상호작용을 위한 AI 디지털 휴먼

일반 소개

기능 목록

도움말 사용

环境创建与模型文件解压

视频准备

使用音频文件运行

实时运行

일반적인 문제

DH live 一键安装包

CatVTON-FLUX: 가상 피팅 체계를 위한 CATVTON과 플럭스 충전 수리 모델의 결합

Galaxy.ai: 시중의 모든 유형의 제너레이티브 AI 도구를 이해하기 위한 1700개 이상의 AI 도구 라이브러리를 통합하는 다기능 플랫폼(유료)

관련 문서

Coding Agent：基于Langgraph构建的简单编程助手

Firebase Studio: 풀스택 애플리케이션을 신속하게 구축하고 배포하는 AI의 클라우드 도구

MediaCrawler：多社交媒体平台内容、视频评论爬虫工具

WPS 마스터 마인드: 지능형 생성, 문서 생성 및 데이터 분석 도구, 포괄적인 지능형 오피스 도우미

댓글 없음

선택한 AI 도구

최신 기사