Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM : un outil efficace d'exploration du Web pour le pré-entraînement LLM

Introduction détaillée Crawl4LLM est un projet open source développé conjointement par l'université Tsinghua et l'université Carnegie Mellon, qui se concentre sur l'optimisation de l'efficacité de l'exploration du web pour le pré-entraînement des grands modèles (LLM). Il réduit considérablement l'inefficacité du crawling en sélectionnant intelligemment des données web de haute qualité, affirmant pouvoir...
Il y a 4 mois
0652
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero : Plate-forme de formation à l'apprentissage par renforcement du raisonnement à grande échelle (Open Source Large-Scale Reasoning Reinforcement Learning)

Introduction générale Open-Reasoner-Zero est un projet open source axé sur la recherche en apprentissage par renforcement (RL), développé par l'équipe Open-Reasoner-Zero sur GitHub. Il vise à fournir une formation efficace, évolutive et facile à ...
Il y a 4 mois
0690
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar : portraits 2D audio de personnes numériques interactives en temps réel, fonctionnant à 30 images par seconde sur l'unité centrale.

Introduction générale LiteAvatar est un outil open source développé par l'équipe HumanAIGC (qui fait partie d'Ali) qui se concentre sur la génération d'animations faciales à partir d'avatars 2D pilotés par l'audio en temps réel. Il fonctionne à 30 images par seconde (fps) en s'appuyant uniquement sur le CPU, et est particulièrement adapté...
Il y a 4 mois
0902
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat : une application de chat de groupe avec de multiples personnages IA interagissant en temps réel

Introduction générale Botgroup.chat est une application de chat de groupe IA open source développée sur la base de React et Cloudflare Pages, visant à fournir aux utilisateurs une expérience interactive similaire au chat de groupe WeChat. Elle permet la participation simultanée de plusieurs personnages...
Il y a 4 mois
0954
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen : un outil open source pour la génération automatique de graphes de connaissances à partir de texte simple

Introduction générale KGGen est un outil open source développé par le Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), hébergé sur GitHub, conçu pour générer automatiquement des graphes de connaissances à partir d'un texte arbitraire. Il utilise des algorithmes avancés de modélisation du langage et de...
Il y a 4 mois
0944
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension : extension de navigateur permettant de synchroniser le contenu généré par l'IA avec les plateformes d'autoédition en un seul clic

Introduction générale MultiPost-Extension est une puissante extension de navigateur conçue pour aider les utilisateurs à publier du contenu sur plusieurs plateformes de médias sociaux en un seul clic. L'extension prend en charge la publication simultanée sur plus de 10 plateformes principales, y compris Zhihu, Weibo, Xiaohongshu, TikTok ...
Il y a 4 mois
0664