大模型微调 | Sharenet

순서대로 정렬

GraphGen: 지식 그래프를 사용하여 합성 데이터를 생성하기 위한 언어 모델 미세 조정

개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...

2개월 전

0471

MiniMind-V：1小时训练26M参数视觉语言模型

综合介绍 MiniMind-V 是一个开源项目，托管于 GitHub，旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型（VLM）。它基于 MiniMind 语言模型，新增视觉...

3 개월 전

0451

DeepCoder-14B-Preview：擅长代码生成的的开源模型

综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...

3 개월 전

0545

WeClone: WeChat 채팅 로그와 음성으로 디지털 도플갱어 훈련하기

종합 소개 WeClone은 대규모 언어 모델 및 음성 합성 기술과 결합된 WeChat 채팅 로그와 음성 메시지를 사용하여 사용자가 개인화된 디지털 도플갱어를 만들 수 있는 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자의 채팅 습관을 분석하여 모델을 훈련시킬 뿐만 아니라 소수의 음성 샘플로 사실적인 소리를 생성할 수 있습니다....

3 개월 전

0599

Search-R1：强化学习训练大模型搜索与推理的工具

综合介绍 Search-R1 是一个开源项目，由 PeterGriffinJin 在 GitHub 上开发，基于 veRL 框架构建。它通过强化学习（RL）技术训练大语言模型（LLM），让模型自主学会...

4개월 전

0656

Optexity：用人类演示训练AI执行网页操作的开源项目

综合介绍 Optexity 是一个在 GitHub 上开源的项目，由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务，尤其是网页操作。项目包含三个代码库：Compute...

4개월 전

0752

분재: 에지 디바이스에서 작동하기에 적합한 3값 가중 언어 모델

综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型，参数规模为 5 亿，采用三值权重（ternary weights）技术。它基于 Llama 架构和 Mistral 分词器...

4개월 전

0663

세컨드 미: 개인의 기억과 습관을 가진 로컬로 학습된 AI 도플갱어

综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目，它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯，变成一个懂你的智...

4개월 전

01K

Easy Dataset：创建大模型微调数据集的简易工具

综合介绍 Easy Dataset 是一个专门为大模型（LLM）微调设计的开源工具，托管在 GitHub 上。它提供了一个简单易用的界面，让用户可以上传文件、自动分割内容、生成问题和答案，最终输出适合...

4개월 전

0928

MM-EUREKA：探索视觉推理的多模态强化学习工具

综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术，把文本推理能力扩展到多模态场景，帮助模型处理图像和文字信息。这个工具的核心...

4개월 전

0672

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集，专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护，托...

4개월 전

0824

X-R1：在普通设备中低成本训练0.5B模型

综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架，旨在为开发者提供一个低成本、高效的工具，用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...

4개월 전

0590

OpenManus-RL：微调大模型强化智能体推理与决策能力

综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目，托管于GitHub。该项目通过强化学习（RL）技术提升大型语言模型（LLM...

4개월 전

0755

TPO-LLM-WebUI: 질문을 입력하여 실시간으로 모델을 학습시키고 결과를 출력할 수 있는 AI 프레임워크입니다.

일반 소개 TPO-LLM-WebUI는 직관적인 웹 인터페이스를 통해 대규모 언어 모델(LLM)을 실시간으로 최적화할 수 있는 Airmomo가 GitHub에서 오픈소스로 제공하는 혁신적인 프로젝트입니다. TPO(Test-Time Pr ...

5개월 전

0761

오픈 리서처-제로: 오픈 소스 대규모 추론 강화 학습 교육 플랫폼

综合介绍 Open-Reasoner-Zero 是一个专注于强化学习（RL）研究的开源项目，由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训...

5개월 전

0804

중국어 기반 풀 블러드 DeepSeek-R1 증류 데이터 세트, 중국어 R1 증류 SFT 데이터 세트 지원

综合介绍中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集，包含110K条数据，旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布，数据集不仅包含数学数据，还包括大量的通用类型...

5개월 전

0842

ColossalAI: 효율적인 대규모 AI 모델 학습 솔루션 제공

综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台，旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练，ColossalAI...

5개월 전

0808

One Shot LoRA：快速生成视频 LoRA 模型的全能平台

综合介绍 One Shot LoRA 是一个专注于从视频生成高质量视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型，无需登录或存储私人数据。该平台支持 Hunyua...

5개월 전

0999

Kiln：简单的LLM模型微调和数据合成工具，0代码基础微调自己的小模型

综合介绍 Kiln 是一个开源工具，专注于大语言模型（LLM）的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序，支持Windows、MacOS和Linux系统，用户可以通过零代码实现对Ll...

최신 AI 도구 # 대형 모델 미세 조정

5개월 전

01.1K