SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo : un outil open source pour segmenter automatiquement des objets arbitraires en mouvement à partir d'une vidéo

Introduction générale SegAnyMo est un projet open source développé par une équipe de chercheurs de l'UC Berkeley et de l'Université de Pékin, comprenant des membres tels que Nan Huang. Cet outil se concentre sur le traitement vidéo et peut automatiquement identifier et segmenter des objets arbitraires en mouvement dans une vidéo, tels que des personnes, des animaux ou...
Il y a 4 mois
0760
GenXD:生成任意3D和4D场景视频的开源框架

GenXD : cadre open source pour la génération de vidéos de scènes 3D et 4D arbitraires

Introduction générale GenXD est un projet open source, développé par l'Université nationale de Singapour (NUS) et l'équipe de Microsoft. Il se concentre sur la génération de scènes 3D et 4D arbitraires, afin de résoudre le problème de la génération de scènes 3D et 4D dans le monde réel en raison de l'insuffisance des données et de la complexité de la conception du modèle. Le projet a été développé par ...
Il y a 4 mois
0696
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone : un outil pour générer des vidéos de portraits humains numériques à mi-corps à partir de photographies

Introduction générale ChatAnyone est un projet innovant développé par l'équipe HumanAIGC. Il utilise des techniques d'intelligence artificielle pour générer des vidéos de portraits humains numériques avec des mouvements du haut du corps à partir d'une seule photo et d'une entrée audio. Le projet est basé sur un modèle de diffusion de mouvement hiérarchique qui génère des mouvements de tête...
Il y a 4 mois
0703
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1 : Apprentissage par renforcement pour former de grands modèles de recherche et de raisonnement

Introduction générale Search-R1 est un projet open source, développé par PeterGriffinJin sur GitHub, construit sur le framework veRL. Il forme de grands modèles de langage (LLM) grâce à des techniques d'apprentissage par renforcement (RL), permettant aux modèles d'apprendre de manière autonome....
Il y a 4 mois
0713
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity : un projet open source pour entraîner l'IA à effectuer des actions sur le web avec des démonstrations humaines

Introduction générale Optexity est un projet open source sur GitHub, développé par l'équipe Optexity. Son objectif principal est d'utiliser des données de démonstration humaines pour entraîner l'IA à effectuer des tâches informatiques, en particulier des opérations sur des pages web. Le projet contient trois bibliothèques de code : Compute...
Il y a 4 mois
0800
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync : un outil open source pour générer des vidéos avec synchronisation labiale directement à partir de l'audio

Introduction générale LatentSync est un outil open source développé par ByteDance et hébergé sur GitHub. Il pilote les mouvements des lèvres des personnages d'une vidéo directement à travers l'audio, de sorte que la forme de la bouche corresponde précisément à la voix. Le projet est basé sur Stable Di...
Il y a 1 mois
01.7K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife : une personne numérique secondaire qui prend en charge la diffusion en direct de la station B et l'interaction vocale.

VirtualWife est un projet open source de personne virtuelle numérique créé par le développeur yakami129. Il est actuellement en phase d'incubation, l'objectif est de créer un personnage virtuel avec une "âme", l'utilisateur peut interagir avec lui comme avec un ami. Le projet est soutenu par B Station Live...
Il y a 4 mois
0756