大模型微调 | Sharenet

mettre en ordre

poste mise à jour écrémer félicitations

GraphGen：利用知识图谱生成合成数据微调语言模型

综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架，托管于 GitHub，专注于通过知识图谱指导合成数据生成，优化大语言模型（LLM）的监督微调。它从...

Il y a 2 mois

0484

MiniMind-V : 1 heure d'entraînement de 26M modèles paramétriques de langage visuel

综合介绍 MiniMind-V 是一个开源项目，托管于 GitHub，旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型（VLM）。它基于 MiniMind 语言模型，新增视觉...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 3 mois

0468

DeepCoder-14B-Preview : un modèle open-source qui excelle dans la génération de code

综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 3 mois

0568

WeClone : former des sosies numériques à l'aide des journaux de conversation et des voix WeChat

Introduction complète WeClone est un projet open source qui utilise les transcriptions de chat et les messages vocaux de WeChat, combinés à de grands modèles de langage et à une technologie de synthèse vocale, pour permettre aux utilisateurs de créer des sosies numériques personnalisés. Le projet peut analyser les habitudes de chat de l'utilisateur pour entraîner le modèle, mais aussi un petit nombre d'échantillons de voix pour générer des sons réalistes...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 3 mois

0614

Search-R1 : Apprentissage par renforcement pour former de grands modèles de recherche et de raisonnement

Introduction générale Search-R1 est un projet open source, développé par PeterGriffinJin sur GitHub, construit sur le framework veRL. Il forme de grands modèles de langage (LLM) grâce à des techniques d'apprentissage par renforcement (RL), permettant aux modèles d'apprendre de manière autonome....

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

0667

Optexity : un projet open source pour entraîner l'IA à effectuer des actions sur le web avec des démonstrations humaines

Introduction générale Optexity est un projet open source sur GitHub, développé par l'équipe Optexity. Son objectif principal est d'utiliser des données de démonstration humaines pour entraîner l'IA à effectuer des tâches informatiques, en particulier des opérations sur des pages web. Le projet contient trois bibliothèques de code : Compute...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle # Desktop Automation Intelligence

Il y a 4 mois

0765

Bonsai : un modèle de langage pondéré à trois valeurs adapté aux appareils périphériques

Introduction générale Bonsai est un modèle de langage open source développé par deepgrove-ai avec une taille de paramètre de 500 millions, utilisant des poids ternaires. Il est basé sur l'architecture Llama et le classificateur Mistral...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

0676

Second Me：本地训练拥有个人记忆和习惯的AI分身

综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目，它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯，变成一个懂你的智...

Derniers outils d'IA # AI Java Open Source Projecct # AI Life Efficiency Assistant # Mise au point du grand modèle

Il y a 4 mois

01K

Easy Dataset : un outil facile à utiliser pour créer de grands ensembles de données finement réglées.

综合介绍 Easy Dataset 是一个专门为大模型（LLM）微调设计的开源工具，托管在 GitHub 上。它提供了一个简单易用的界面，让用户可以上传文件、自动分割内容、生成问题和答案，最终输出适合...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

0943

MM-EUREKA：探索视觉推理的多模态强化学习工具

综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术，把文本推理能力扩展到多模态场景，帮助模型处理图像和文字信息。这个工具的核心...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

0686

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit by Ostris : Diffusion stable avec FLUX.1 Model Training Toolkit

Introduction générale AI Toolkit by Ostris est un ensemble d'outils d'IA open source axé sur la prise en charge des modèles Stable Diffusion et FLUX.1 pour les tâches d'entraînement et de génération d'images. La boîte à outils est créée et maintenue par le développeur Ostris, tor...

Derniers outils d'IA # AI Aides à la génération d'images # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

0843

X-R1：在普通设备中低成本训练0.5B模型

综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架，旨在为开发者提供一个低成本、高效的工具，用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

0599

OpenManus-RL：微调大模型强化智能体推理与决策能力

综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目，托管于GitHub。该项目通过强化学习（RL）技术提升大型语言模型（LLM...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

Il y a 4 mois

0776

TPO-LLM-WebUI：输入问题即可实时训练模型输出结果的AI框架

综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目，通过直观的 Web 界面实现大语言模型（LLM）的实时优化。它采用 TPO（Test-Time Pr...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

0768

Open-Reasoner-Zero : Plate-forme de formation à l'apprentissage par renforcement du raisonnement à grande échelle (Open Source Large-Scale Reasoning Reinforcement Learning)

Introduction générale Open-Reasoner-Zero est un projet open source axé sur la recherche en apprentissage par renforcement (RL), développé par l'équipe Open-Reasoner-Zero sur GitHub. Il vise à fournir une formation efficace, évolutive et facile à ...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

0820

Ensemble de données de distillation DeepSeek-R1 à sang complet basé en Chine, prend en charge l'ensemble de données SFT de distillation R1 en Chine

Introduction complète Le jeu de données chinois DeepSeek-R1 distillation est un jeu de données chinois open source contenant 110 000 pièces de données conçues pour soutenir l'apprentissage automatique et la recherche sur le traitement du langage naturel. Le jeu de données est publié par l'équipe NLP de Cong Liu. Le jeu de données contient non seulement des données mathématiques, mais aussi un grand nombre de types généraux...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

0856

ColossalAI : des solutions efficaces pour la formation de modèles d'IA à grande échelle

综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台，旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练，ColossalAI...

Derniers outils d'IA # AI Java Open Source Projecct # Mise au point du grand modèle

il y a 5 mois

0819

One Shot LoRA : la plateforme tout-en-un pour la génération rapide de modèles vidéo LoRA

Introduction générale One Shot LoRA est une plateforme destinée à générer des modèles LoRA de haute qualité à partir de vidéos. Les utilisateurs peuvent rapidement et facilement former des modèles LoRA de boutique à partir de vidéos sans avoir à se connecter ou à stocker des données privées. La plateforme prend en charge Hunyua...

Derniers outils d'IA # AI Aides à la génération d'images # Mise au point du grand modèle

il y a 5 mois

01K