LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync : un outil open source pour générer des vidéos avec synchronisation labiale directement à partir de l'audio

Introduction générale LatentSync est un outil open source développé par ByteDance et hébergé sur GitHub. Il pilote les mouvements des lèvres des personnages d'une vidéo directement à travers l'audio, de sorte que la forme de la bouche corresponde précisément à la voix. Le projet est basé sur Stable Di...
Il y a 2 mois
01.5K0
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk : générez des vidéos parlantes expressives avec une seule image d'avatar !

DreamTalk Introduction complète DreamTalk est un cadre de génération de têtes parlantes basé sur un modèle de diffusion et développé conjointement par l'université de Tsinghua, le groupe Alibaba et l'université des sciences et technologies de Huazhong. Il se compose principalement de trois parties : un réseau de réduction du bruit, un expert en lèvres conscient du style et un prédicteur de style, qui peut être basé sur...
Il y a 6 mois
01.5K0