DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk : générez des vidéos parlantes expressives avec une seule image d'avatar !

DreamTalk Introduction complète DreamTalk est un cadre de génération de têtes parlantes basé sur un modèle de diffusion et développé conjointement par l'université de Tsinghua, le groupe Alibaba et l'université des sciences et technologies de Huazhong. Il se compose principalement de trois parties : un réseau de réduction du bruit, un expert en lèvres conscient du style et un prédicteur de style, qui peut être basé sur...
Il y a 6 mois
01.5K0
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund : système de négociation automatisé open source qui utilise des intelligences multiples pour prendre des décisions complexes en matière de négociation de fonds spéculatifs.

Introduction générale AI Hedge Fund est un fonds spéculatif d'intelligence artificielle qui utilise un système multi-agents pour prendre des décisions de trading. Le système travaille en tandem avec de multiples agents spécialisés, y compris des agents de données de marché, des agents quantitatifs, des agents de gestion du risque et des agents de gestion de portefeuille, afin de réaliser des transactions complexes....
Il y a 4 mois
01.4K0
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI : Narration cinématographique et télévisuelle générée par le texte et outil de montage automatisé

Introduction générale NarratoAI est un outil entièrement automatisé qui intègre la narration de films et de vidéos, l'édition automatisée, le doublage et la génération de sous-titres. Il s'appuie sur la technologie de modélisation du langage à grande échelle (LLM) pour générer automatiquement des textes et éditer automatiquement des vidéos avec les voix off et les sous-titres correspondants,...
Il y a 9 mois
01.4K0
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0 : basé sur le modèle d'OCR multimodal de bout en bout QWen2 0.5B

Introduction complète GOT-OCR2.0 est un modèle de reconnaissance optique de caractères (OCR) Open Source co-proposé par StepStar, qui vise à faire évoluer la technologie OCR vers OCR-2.0 grâce à un modèle unifié de bout en bout. Le modèle prend en charge un large éventail de tâches d'OCR, y compris la reconnaissance de textes normaux, de gr...
Il y a 9 mois
01.4K0
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw : outil de tableau blanc virtuel dessiné à la main | Organigramme de génération de texte piloté par l'IA | Tutoriels Excalidraw

Excalidraw Description générale Excalidraw est un outil de dessin de tableau blanc virtuel open source qui vous permet de dessiner facilement des diagrammes avec un style dessiné à la main. Vous pouvez utiliser Excalidraw pour créer de magnifiques illustrations, des diagrammes filaires ou n'importe quel...
Il y a 7 mois
01.4K0
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI : Assistant conversationnel d'analyse de données avec accès direct aux réponses, aux requêtes SQL et aux rapports d'analyse

Introduction générale WrenAI est un assistant SQL AI open source conçu spécifiquement pour aider les équipes de données, les équipes de produits et les équipes commerciales à obtenir des informations sur les données par le biais d'un dialogue en langage naturel. Il est capable de convertir le langage naturel en requêtes SQL, de générer des graphiques, des feuilles de calcul et des rapports, de...
il y a 5 mois
01.4K0
留痕(WeChatMsg):微信聊天记录导出与分析工具

Leave Trace (WeChatMsg) : Outil d'exportation et d'analyse des enregistrements de conversations sur WeChat

Introduction générale WeChatMsg est un projet open source situé sur la plateforme GitHub. L'outil vise à fournir aux utilisateurs de WeChat un moyen d'extraire et d'exporter les chats WeChat dans une variété de documents (HTML, Word, CSV), et à soutenir la génération de rapports annuels de visualisation des données de chat...
Il y a 10 mois
01.4K0
E2B:安全云沙箱中的AI代码运行平台

E2B : plateforme d'exécution de code d'IA dans un bac à sable sécurisé dans le nuage

Introduction générale E2B est une plateforme open source conçue pour exécuter du code généré par l'IA dans un bac à sable sécurisé dans le nuage. Elle prend en charge un large éventail de langages de programmation et de cadres et fournit un environnement virtuel isolé pour garantir la sécurité et la fiabilité de l'exécution du code.E2B convient à une variété de scénarios d'application de l'IA, y compris le partitionnement des données...
il y a 5 mois
01.4K0
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS : un modèle de génération de la parole qui imite la voix d'une personne réelle qui parle (ChatTTS one-click acceleration package)

Introduction générale ChatTTS est un modèle de parole génératif conçu pour les scénarios de dialogue. Il génère une parole naturelle et expressive, prend en charge plusieurs langues et plusieurs locuteurs, et convient aux dialogues interactifs. Pour ce faire, le modèle prédit et contrôle des caractéristiques rythmiques fines telles que les rires, les pauses et les interjections, sup...
Il y a 4 mois
01.4K0
Novel:模仿Notion AI的开源写作编辑器

Novel : un éditeur d'écriture open source qui imite Notion AI

Introduction complète Il s'agit d'un projet open source développé par Steven Tey appelé Novel, c'est un éditeur de texte WYSIWYG de style Notion, intégrant une fonction d'auto-complétion AI qui peut aider les utilisateurs à améliorer l'efficacité de la saisie de texte. Le projet fournit une documentation détaillée et des instructions d'installation...
Il y a 10 mois
01.4K0
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip : outil de synchronisation labiale vidéo de haute qualité, optimisé pour Wav2Lip

Introduction générale Easy-Wav2Lip est un outil amélioré basé sur Wav2Lip conçu pour simplifier le processus de synchronisation labiale des vidéos. L'outil offre une configuration et une implémentation plus simples avec un support pour Google Colab et une installation locale. En optimisant l'algorithme, Ea...
Il y a 6 mois
01.4K0
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot : outil de traitement intelligent de l'information sur le Web, API gratuite pour la capture de contenu Web

WebPilot Introduction générale WebPilot est un "assistant web" gratuit et open source qui vous permet de communiquer librement avec n'importe quelle page web ou d'effectuer des tâches automatisées. Vous n'avez pas besoin de changer de page ou de copier-coller, il vous suffit de sélectionner du texte ou d'entrer des commandes, webpilot...
Il y a 9 mois
01.4K0
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio : génération d'effets sonores synchronisés et de bandes sonores pour des séquences vidéo, outil de coformation multimodale vidéo/audio

Introduction générale MMAudio est un projet open source visant à générer un son synchronisé de haute qualité par le biais d'une formation multimodale conjointe. Développé par Ho Kei Cheng et al. à l'Université chinoise de Hong Kong, la fonction principale du projet est de générer de l'audio synchronisé à partir d'une vidéo et/ou d'un texte....
Il y a 6 mois
01.4K0
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa : Ajustement virtuel de modèle haute fidélité et ajustement de la pose du personnage, modèle de génération d'image de personnage contrôlable Meta open source

Introduction Leffa est un cadre unifié pour la génération d'images de personnages contrôlables, permettant une manipulation précise de l'apparence du personnage (par exemple, l'ajustement virtuel) et de la pose (par exemple, le transfert de la pose). Le cadre réduit considérablement la distorsion des détails les plus fins en orientant la requête cible vers la clé de référence correcte dans la couche d'attention, avec...
Il y a 6 mois
01.4K0