Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM : un outil efficace d'exploration du Web pour le pré-entraînement LLM

Introduction détaillée Crawl4LLM est un projet open source développé conjointement par l'université Tsinghua et l'université Carnegie Mellon, qui se concentre sur l'optimisation de l'efficacité de l'exploration du web pour le pré-entraînement des grands modèles (LLM). Il réduit considérablement l'inefficacité du crawling en sélectionnant intelligemment des données web de haute qualité, affirmant pouvoir...
il y a 5 mois
0798
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero : Plate-forme de formation à l'apprentissage par renforcement du raisonnement à grande échelle (Open Source Large-Scale Reasoning Reinforcement Learning)

Introduction générale Open-Reasoner-Zero est un projet open source axé sur la recherche en apprentissage par renforcement (RL), développé par l'équipe Open-Reasoner-Zero sur GitHub. Il vise à fournir une formation efficace, évolutive et facile à ...
il y a 5 mois
0860
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar : portraits 2D audio de personnes numériques interactives en temps réel, fonctionnant à 30 images par seconde sur l'unité centrale.

Introduction générale LiteAvatar est un outil open source développé par l'équipe HumanAIGC (qui fait partie d'Ali) qui se concentre sur la génération d'animations faciales à partir d'avatars 2D pilotés par l'audio en temps réel. Il fonctionne à 30 images par seconde (fps) en s'appuyant uniquement sur le CPU, et est particulièrement adapté...
il y a 5 mois
01.1K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat : une application de chat de groupe avec de multiples personnages IA interagissant en temps réel

Introduction générale Botgroup.chat est une application de chat de groupe IA open source développée sur la base de React et Cloudflare Pages, visant à fournir aux utilisateurs une expérience interactive similaire au chat de groupe WeChat. Elle permet la participation simultanée de plusieurs personnages...
il y a 5 mois
01.4K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen : un outil open source pour la génération automatique de graphes de connaissances à partir de texte simple

Introduction générale KGGen est un outil open source développé par le Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), hébergé sur GitHub, conçu pour générer automatiquement des graphes de connaissances à partir d'un texte arbitraire. Il utilise des algorithmes avancés de modélisation du langage et de...
il y a 5 mois
01.1K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension : extension de navigateur permettant de synchroniser le contenu généré par l'IA avec les plateformes d'autoédition en un seul clic

Introduction générale MultiPost-Extension est une puissante extension de navigateur conçue pour aider les utilisateurs à publier du contenu sur plusieurs plateformes de médias sociaux en un seul clic. L'extension prend en charge la publication simultanée sur plus de 10 plateformes principales, y compris Zhihu, Weibo, Xiaohongshu, TikTok ...
il y a 5 mois
0840
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI : client d'assistant intelligent pour le chat de groupe WeChat pour Windows

Introduction WeChatAI est un assistant intelligent personnel et de chat de groupe WeChat basé sur Python, supportant une variété de grands modèles de langage (tels que DeepSeek, Gemini, Tongyi Thousand Questions), qui peut réaliser des dialogues intelligents, des réponses automatiques et d'autres fonctions. Le projet utilise des modèles ...
il y a 5 mois
0993
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG : un moteur de recherche pour les données non structurées et les requêtes complexes

Introduction générale dsRAG est un moteur de recherche de haute performance conçu pour traiter des requêtes complexes sur des données non structurées. Il est particulièrement performant pour les requêtes complexes dans des textes denses tels que les rapports financiers, les documents juridiques et les articles académiques. dsRAG utilise trois approches clés pour améliorer les performances : le langage...
il y a 5 mois
0852
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti : outil de construction et d'interrogation de graphes de connaissances dynamiques (programme de mémoire longue sensible au temps)

Introduction générale Graphiti est un outil développé par getzep pour construire et interroger des graphes de connaissances dynamiques et temporels. Il est capable de représenter des relations complexes et évolutives entre les entités et de les interroger par le biais d'une variété de méthodes telles que les algorithmes temporels, plein texte, sémantiques et de graphe....
il y a 5 mois
01K