EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic : portraits audio pour générer des vidéos parlantes (EchoMimicV2 accelerated installer)

Introduction générale EchoMimic est un projet open source conçu pour générer des animations de portraits réalistes pilotées par l'audio. Développé par la division Terminal Technologies d'Ant Group, le projet utilise des conditions de points de repère modifiables pour générer des vidéos de portraits dynamiques en utilisant une combinaison de points de repère audio et faciaux....
il y a 5 mois
01.4K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez : générer des livres audio, convertir des livres électroniques en livres audio avec Kokoro

Introduction générale Audiblez est un projet open source conçu pour convertir les livres électroniques (format .epub) en livres audio (format .m4b). Le projet utilise la technologie de synthèse vocale de haute qualité de Kokoro pour prendre en charge plusieurs langues et plusieurs voix. Les utilisateurs peuvent simplement...
il y a 5 mois
01.1K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Recherche o1 : Permettre aux modèles d'inférence d'effectuer des recherches actives, en permettant aux grands modèles de rechercher des connaissances externes tout en réfléchissant.

综合介绍 Search-o1 是一个开源项目,旨在通过整合高级搜索机制来增强大规模推理模型(LRMs)的性能。其核心思想是通过动态的搜索和知识整合来解决推理过程中遇到的知识缺失问题。该项目由 sunn...
il y a 5 mois
0948