LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: herramienta de código abierto para generar vídeo con sincronización labial directamente a partir de audio

Introducción general LatentSync es una herramienta de código abierto desarrollada por ByteDance y alojada en GitHub. Controla los movimientos labiales de los personajes de un vídeo directamente a través del audio, de modo que la forma de la boca coincide con la voz con precisión. El proyecto se basa en Stable Di...
hace 1 mes
01.7K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: un asistente de chat con inteligencia artificial compatible con múltiples plataformas

Introducción general NextChat es un revolucionario servicio de chat con IA que permite a los usuarios implementar servicios de chat con los mejores modelos lingüísticos de su clase, como GPT-3, GPT-4, GPT-4.5 y Gemini Pro. Ofrece una elegante interfaz de usuario, funciones de colaboración, integraciones, plantillas y...
hace 5 meses
01.7K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund: sistema de negociación automatizado de código abierto que utiliza inteligencias múltiples para tomar decisiones complejas de negociación en fondos de cobertura.

综合介绍 AI Hedge Fund 是一个利用多代理系统进行交易决策的人工智能对冲基金。该系统通过多个专门的代理协同工作,包括市场数据代理、量化代理、风险管理代理和投资组合管理代理,以实现复杂的交易...
hace 6 meses
01.7K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

DreamTalk Introducción DreamTalk es un marco de generación de cabezas parlantes basado en modelos de difusión y expresión desarrollado conjuntamente por la Universidad Tsinghua, Alibaba Group y la Universidad Huazhong de Ciencia y Tecnología. Consta principalmente de tres partes: una red de reducción de ruido, un experto en labios consciente del estilo y un predictor de...
hace 7 meses
01.7K