HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni : un macromodèle multimodal pour l'analyse des émotions et des actions des vidéos humaines

Introduction générale HumanOmni est un grand modèle multimodal open source développé par l'équipe HumanMLLM et hébergé sur GitHub. Il se concentre sur l'analyse de vidéos humaines et peut traiter à la fois l'image et le son pour aider à comprendre les émotions, les actions et le contenu du dialogue. Le projet a utilisé 2...
Il y a 3 mois
0542