Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola : application web de chat IA open source avec téléchargement de documents et prise en charge de modèles multiples

Introduction générale Zola est une application de chat IA gratuite et open source développée par le développeur Julien Thibeaut (nom d'utilisateur GitHub ibelick) et hébergée sur GitHub. Sa meilleure caractéristique est qu'elle supporte plusieurs modes d'IA...
Il y a 4 mois
0671
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher : IA de conduite basée sur l'apprentissage par renforcement pour étudier les problèmes complexes

Introduction complète DeepResearcher est un projet open source développé par l'équipe GAIR-NLP de l'Université Jiao Tong de Shanghai. Il s'agit d'un outil de recherche intelligent basé sur de grands modèles de langage (LLM), formés de bout en bout dans des environnements Web réels grâce à l'apprentissage par renforcement (RL). Le projet ...
Il y a 4 mois
0571
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer : un outil open source pour générer des vidéos d'animation et des interactions entre personnages à l'aide de commandes linguistiques

AnimeGamer est un outil open source du laboratoire ARC de Tencent. Les utilisateurs peuvent générer des vidéos d'anime à l'aide de commandes linguistiques simples, telles que "Sousuke roule dans une voiture violette", et permettre à différents personnages d'anime d'interagir entre eux, tels que Kiki de Magical Girl's Adventure et Sky City...
Il y a 4 mois
0681
Agent S:像人类一样操作电脑的开源智能体框架

Agent S : un cadre Open Source pour les corps intelligents qui utilisent les ordinateurs comme des humains

Introduction générale Agent S est un framework open-source développé par Simular AI qui permet à des intelligences d'utiliser des ordinateurs comme des humains à travers une interface utilisateur graphique (GUI). Il utilise un modèle de langage multimodal et des techniques d'apprentissage empirique pour effectuer des tâches telles que la navigation sur le web, l'édition de documents, l'utilisation de logiciels...
Il y a 4 mois
0675
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice : une interface graphique de synthèse vocale basée sur des API de flux au silicium

Introduction générale Text2Voice est un outil open source qui fournit une fonctionnalité de synthèse vocale basée sur une API de mobilité au silicium, avec une interface utilisateur graphique (GUI) propre comme sa meilleure caractéristique. Il a été créé par le développeur Sheldon Lee sur GitHub pour permettre...
Il y a 4 mois
0593
YOLOE:实时视频检测和分割物体的开源工具

YOLOE : un outil open source pour la détection vidéo en temps réel et la segmentation d'objets

YOLOE est un projet open source développé par le Multimedia Intelligence Group (THU-MIG) de la School of Software de l'Université de Tsinghua, dont le nom complet est "You Only Look Once Eye". Il est basé sur le framework PyTorch, qui appartient à la série d'extensions YOLO...
Il y a 4 mois
0752
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind : projet open source de positionnement des vidéos en fonction de l'heure, du contenu et des questions-réponses

Introduction générale VideoMind est un outil d'IA multimodale open source qui se concentre sur l'inférence, les questions-réponses et la génération de résumés pour les vidéos de longue durée. Il a été développé par Ye Liu de l'Université polytechnique de Hong Kong et une équipe du Show Lab de l'Université nationale de Singapour. L'outil imite la compréhension humaine des vidéos...
Il y a 1 mois
0828