CHARGEMENT

Sharenet
  • Tutoriels pratiques sur l'IA
  • Commandes d'utilitaires AI
  • Informations sur le cours
  • Base de connaissances sur l'IA
  • Réponses AI
  • Je veux contribuer
    • Principales recommandations en matière d'IA
    • Derniers outils d'IA
    • Rédaction d'articles sur l'IA
    • Génération d'images par l'IA
    • Outils vidéo sur l'IA
    • Efficacité de l'IA dans les bureaux
    • Outils de programmation de l'IA
    • Outils de conception d'IA
    • Assistant de chat AI
    • AI Intelligence

    大模型微调

    共 28 篇文章
    mettre en ordre
    postemise à jourécrémerfélicitations
    GraphGen:利用知识图谱生成合成数据微调语言模型

    GraphGen:利用知识图谱生成合成数据微调语言模型

    综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle# Knowledge Graph
    4周前
    01920
    MiniMind-V:1小时训练26M参数视觉语言模型

    MiniMind-V:1小时训练26M参数视觉语言模型

    综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 2 mois
    02340
    DeepCoder-14B-Preview:擅长代码生成的的开源模型

    DeepCoder-14B-Preview:擅长代码生成的的开源模型

    综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 2 mois
    03100
    WeClone:用微信聊天记录和语音训练数字分身

    WeClone : former des sosies numériques à l'aide des journaux de conversation et des voix WeChat

    综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 2 mois
    03490
    Search-R1:强化学习训练大模型搜索与推理的工具

    Search-R1:强化学习训练大模型搜索与推理的工具

    综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 2 mois
    04610
    Optexity:用人类演示训练AI执行网页操作的开源项目

    Optexity:用人类演示训练AI执行网页操作的开源项目

    综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle# Desktop Automation Intelligence
    Il y a 2 mois
    05260
    Bonsai:适合边缘设备运行的三值权重语言模型

    Bonsai : un modèle de langage pondéré à trois valeurs adapté aux appareils périphériques

    综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 2 mois
    04610
    Second Me:本地训练拥有个人记忆和习惯的AI分身

    Second Me:本地训练拥有个人记忆和习惯的AI分身

    综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...
    Derniers outils d'IA# AI Java Open Source Projecct# AI Life Efficiency Assistant# Mise au point du grand modèle
    Il y a 2 mois
    06980
    Easy Dataset:创建大模型微调数据集的简易工具

    Easy Dataset:创建大模型微调数据集的简易工具

    综合介绍 Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 2 mois
    06630
    MM-EUREKA:探索视觉推理的多模态强化学习工具

    MM-EUREKA:探索视觉推理的多模态强化学习工具

    综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    04570
    AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

    AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

    综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托...
    Derniers outils d'IA# AI Aides à la génération d'images# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    05700
    X-R1:在普通设备中低成本训练0.5B模型

    X-R1:在普通设备中低成本训练0.5B模型

    综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    03700
    OpenManus-RL:微调大模型强化智能体推理与决策能力

    OpenManus-RL:微调大模型强化智能体推理与决策能力

    综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    05190
    TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

    TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

    综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Pr...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    05520
    Open-Reasoner-Zero:开源大规模推理强化学习训练平台

    Open-Reasoner-Zero:开源大规模推理强化学习训练平台

    综合介绍 Open-Reasoner-Zero 是一个专注于强化学习(RL)研究的开源项目,由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    05770
    中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

    中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

    综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    06260
    ColossalAI:提供高效大规模AI模型训练解决方案

    ColossalAI:提供高效大规模AI模型训练解决方案

    综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台,旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练,ColossalAI...
    Derniers outils d'IA# AI Java Open Source Projecct# Mise au point du grand modèle
    Il y a 3 mois
    05890
    One Shot LoRA:快速生成视频 LoRA 模型的全能平台

    One Shot LoRA:快速生成视频 LoRA 模型的全能平台

    综合介绍 One Shot LoRA 是一个专注于从视频生成高质量 视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型,无需登录或存储私人数据。该平台支持 Hunyua...
    Derniers outils d'IA# AI Aides à la génération d'images# Mise au point du grand modèle
    Il y a 4 mois
    07730
    Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

    Kiln : Outil simple de mise au point de modèles LLM et de synthèse de données, base de code 0 pour mettre au point vos propres mini-modèles !

    综合介绍 Kiln 是一个开源工具,专注于大语言模型(LLM)的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序,支持Windows、MacOS和Linux系统,用户可以通过零代码实现对Ll...
    Derniers outils d'IA# Mise au point du grand modèle
    Il y a 4 mois
    09180
    En savoir plus
    Sharenet
    Sharenet.ai, le meilleur et le plus complet des guides et outils de navigation pour l'apprentissage de l'IA. Ensemble, embrassons la vague de l'IA ! Ctrl + D ou ⌘ + D Ajoutez ce site à la barre de signets de votre navigateur ❤️

    Demande de lien amicaldéclaration niant ou limitant la responsabilitéCoopération en matière de publicitéÀ propos de nous

    Copyright © 2025 Sharenet 
    fr_FRFrançais
    fr_FRFrançaiszh_CN简体中文 en_USEnglish ja日本語 ko_KR한국어 es_ESEspañol de_DEDeutsch pt_BRPortuguês do Brasil
    écrits
    écritsadresse webmatériellivre