BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2 : Modèle d'apprentissage profond pour la suppression rapide de l'arrière-plan dans les images et les vidéos

Introduction complète BEN2 (Background Erase Network 2) est un modèle d'apprentissage profond développé par Prama LLC spécifiquement conçu pour supprimer automatiquement l'arrière-plan d'une image et générer une image de premier plan. Le modèle utilise une méthode innovante de Confiden...
Il y a 1 mois
01.2K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind : projet open source de positionnement des vidéos en fonction de l'heure, du contenu et des questions-réponses

Introduction générale VideoMind est un outil d'IA multimodale open source qui se concentre sur l'inférence, les questions-réponses et la génération de résumés pour les vidéos de longue durée. Il a été développé par Ye Liu de l'Université polytechnique de Hong Kong et une équipe du Show Lab de l'Université nationale de Singapour. L'outil imite la compréhension humaine des vidéos...
Il y a 1 mois
0797
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync : un outil open source pour générer des vidéos avec synchronisation labiale directement à partir de l'audio

Introduction générale LatentSync est un outil open source développé par ByteDance et hébergé sur GitHub. Il pilote les mouvements des lèvres des personnages d'une vidéo directement à travers l'audio, de sorte que la forme de la bouche corresponde précisément à la voix. Le projet est basé sur Stable Di...
Il y a 1 mois
01.7K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem : le produit open source Heygen Digital Human Pincushion de Silicon Intelligence

Introduction générale HeyGem est un outil de composition vidéo entièrement hors ligne conçu pour les systèmes Windows, développé par l'équipe GuijiAI (Silicon Intelligence) et ouvert sur GitHub. Il utilise des algorithmes d'intelligence artificielle avancés pour cloner avec précision l'apparence et la voix de l'utilisateur...
Il y a 1 mois
0984
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat : dialogue vocal naturel à faible latence avec l'IA

Introduction générale RealtimeVoiceChat est un projet open source axé sur les conversations naturelles en temps réel avec l'intelligence artificielle par le biais de la voix. Les utilisateurs utilisent un microphone pour saisir leur voix, et le système capture l'audio via un navigateur, le convertit rapidement en texte, et un grand modèle de langage (LLM) génère...
Il y a 2 mois
0563