GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する

包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークであり、GitHubでホストされている。GraphGenは、知識グラフを通して合成データ生成を導くことによって、大規模言語モデル(LLM)の教師ありファインチューニングを最適化することに焦点を当てている。LLMは...
2ヶ月前
0467
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V:26Mパラメトリック視覚言語モデルの1時間トレーニング

概要 MiniMind-Vは、GitHubでホストされているオープンソースプロジェクトで、わずか2600万個のパラメータを持つ軽量な視覚言語モデル(VLM)を1時間以内に学習できるように設計されています。MiniMind 言語モデルをベースに、新しいビジュアル...
3ヶ月前
0449
WeClone:用微信聊天记录和语音训练数字分身

WeClone:WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成

総合的な紹介 WeCloneは、WeChatのチャット記録と音声メッセージを、大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使ってリアルな音声を生成することができます。
3ヶ月前
0599
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: 検索と推論のための大規模モデルを学習する強化学習

概要 Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトであり、veRLフレームワーク上に構築されている。強化学習(RL)技術によって大規模言語モデル(LLM)を学習し、モデルが自律的に学習することを可能にします...
4ヶ月前
0655
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト

概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの核心は、人間のデモ・データを使って、コンピュータ・タスク、特にウェブ・ページ操作をこなすAIを訓練することである。このプロジェクトには3つのコードライブラリが含まれている。
4ヶ月前
0746
Second Me:本地训练拥有个人记忆和习惯的AI分身

セカンド・ミー:個人的な記憶と習慣を持つ、現地で訓練されたAIドッペルゲンガー

Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作り、あなたの言葉や記憶を通してあなたの話し方や癖を学習し、あなたのことを理解する賢い人間になることができる。
4ヶ月前
01K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: 大規模モデルの微調整データセットを作成するシンプルなツール

包括的な紹介 Easy Datasetは、大規模モデル(LLM)を微調整するために特別に設計されたオープンソースツールで、GitHubでホストされています。ファイルのアップロード、コンテンツの自動セグメント化、質問と回答の生成、そして最終的に適切なLLMの出力を可能にする、使いやすいインターフェースを提供します。
4ヶ月前
0927
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA:視覚的推論を探求するマルチモーダル強化学習ツール

MM-EUREKAは、上海交通大学の上海人工知能研究所とその他の関係者によって開発されたオープンソースプロジェクトです。ルールベースの強化学習技術により、テキスト推論機能をマルチモーダルシナリオに拡張し、モデルによる画像とテキスト情報の処理を支援します。このツールのコア...
4ヶ月前
0672
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

オストリスによるAIツールキット:FLUX.1モデルトレーニングツールキットによる安定した拡散

概論 OstrisによるAI Toolkitは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに重点を置いたオープンソースのAIツールセットです。このツールセットは、開発者のOstrisによって作成・保守されています。
4ヶ月前
0821
X-R1:在普通设备中低成本训练0.5B模型

X-R1:一般的なデバイスの0.5Bモデルを低コストでトレーニング

一般的な紹介 X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づいてモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。このプロジェクトはDeepSeek...によってサポートされている。
4ヶ月前
0589
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: 大規模モデルの微調整による知的身体推論と意思決定の強化

概論 OpenManus-RLは、UIUC-UlabがMetaGPTコミュニティのOpenManusチームと共同で開発したオープンソースプロジェクトであり、GitHubでホストされている。このプロジェクトは、強化学習(RL)技術によって大規模言語モデリング(LLM)を強化する...
4ヶ月前
0753
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI:質問を入力してリアルタイムにモデルを学習し、結果を出力できるAIフレームワーク。

概論 TPO-LLM-WebUIは、AirmomoがGitHubでオープンソース化している革新的なプロジェクトで、直感的なWebインターフェースを通じて大規模言語モデル(LLM)のリアルタイム最適化を可能にします。TPO (Test-Time Pr...
5ヶ月前
0761
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介 中国語DeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された、110Kのデータを含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的なデータだけでなく、一般的なタイプのデータも多数含まれている。
5ヶ月前
0836
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: 効率的な大規模AIモデル学習ソリューションの提供

包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースのプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIは...
5ヶ月前
0806
One Shot LoRA:快速生成视频 LoRA 模型的全能平台

ワンショットLoRA:迅速なビデオLoRAモデル生成のためのオールインワンプラットフォーム

概要 One Shot LoRAは、動画から高品質の動画LoRAモデルを生成することに特化したプラットフォームです。ユーザーは、ログインや個人データの保存をすることなく、動画から素早く簡単にブティックLoRAモデルをトレーニングすることができます。このプラットフォームはHunyua...
5ヶ月前
0997
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

Kiln: シンプルなLLMモデルの微調整とデータ合成ツール!

包括的な紹介 Kilnは、大規模言語モデル(LLM)の微調整、合成データの生成、およびデータセットのコラボレーションに焦点を当てたオープンソースツールです。Windows、MacOS、Linuxシステムをサポートする直感的なデスクトップアプリケーションを提供し、LLMのゼロコード実装を可能にします。
5ヶ月前
01.1K