GraphGen:利用知识图谱生成合成数据微调语言模型综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정# 지식 그래프4주 전02200
MiniMind-V:1小时训练26M参数视觉语言模型综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정2개월 전02530
DeepCoder-14B-Preview:擅长代码生成的的开源模型综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정2개월 전03280
WeClone:用微信聊天记录和语音训练数字分身综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정2개월 전03640
Search-R1:强化学习训练大模型搜索与推理的工具综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정2개월 전04790
Optexity:用人类演示训练AI执行网页操作的开源项目综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정# 데스크톱 자동화 인텔리전스2개월 전05360
분재: 에지 디바이스에서 작동하기에 적합한 3값 가중 언어 모델综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정2개월 전04750
Second Me:本地训练拥有个人记忆和习惯的AI分身综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...최신 AI 도구# AI 자바 오픈 소스 프로젝트# AI 생활 효율 도우미# 대형 모델 미세 조정2개월 전07180
Easy Dataset:创建大模型微调数据集的简易工具综合介绍 Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정2개월 전06790
MM-EUREKA:探索视觉推理的多模态强化学习工具综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전04750
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托...최신 AI 도구# AI 이미지 생성 보조 장치# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전05860
X-R1:在普通设备中低成本训练0.5B模型综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전03840
OpenManus-RL:微调大模型强化智能体推理与决策能力综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전05300
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Pr...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전05680
Open-Reasoner-Zero:开源大规模推理强化学习训练平台综合介绍 Open-Reasoner-Zero 是一个专注于强化学习(RL)研究的开源项目,由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전05940
중국어 기반 풀 블러드 DeepSeek-R1 증류 데이터 세트, 중국어 R1 증류 SFT 데이터 세트 지원综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전06400
ColossalAI:提供高效大规模AI模型训练解决方案综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台,旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练,ColossalAI...최신 AI 도구# AI 자바 오픈 소스 프로젝트# 대형 모델 미세 조정3 개월 전06020
One Shot LoRA:快速生成视频 LoRA 模型的全能平台综合介绍 One Shot LoRA 是一个专注于从视频生成高质量 视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型,无需登录或存储私人数据。该平台支持 Hunyua...최신 AI 도구# AI 이미지 생성 보조 장치# 대형 모델 미세 조정4개월 전07890
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型综合介绍 Kiln 是一个开源工具,专注于大语言模型(LLM)的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序,支持Windows、MacOS和Linux系统,用户可以通过零代码实现对Ll...최신 AI 도구# 대형 모델 미세 조정4개월 전09360