GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: Feinabstimmung von Sprachmodellen mithilfe von Wissensgraphen zur Erzeugung synthetischer Daten

Umfassende Einführung GraphGen ist ein Open-Source-Framework, das von OpenScienceLab, einem KI-Labor in Shanghai, entwickelt wurde und auf GitHub gehostet wird. Es konzentriert sich auf die Optimierung der überwachten Feinabstimmung von Large Language Models (LLMs), indem es die Erzeugung synthetischer Daten durch Wissensgraphen anleitet. Es wurde entwickelt aus ...
vor 4 Wochen
02200
WeClone:用微信聊天记录和语音训练数字分身

WeClone: Ausbildung von digitalen Doppelgängern mit WeChat-Chat-Protokollen und Stimmen

Umfassende Einführung WeClone ist ein Open-Source-Projekt, das WeChat-Chat-Protokolle und Sprachnachrichten in Kombination mit großen Sprachmodellen und Sprachsynthesetechnologie verwendet, um Benutzern die Erstellung personalisierter digitaler Doppelgänger zu ermöglichen. Das Projekt kann die Chat-Gewohnheiten des Benutzers analysieren, um das Modell zu trainieren, aber auch eine kleine Anzahl von Stimmproben, um einen realistischen Klang zu erzeugen...
vor 2 Monaten
03640
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: ein Open-Source-Projekt zum Trainieren von KI für die Durchführung von Webaktionen mit menschlichen Demonstrationen

Allgemeine Einführung Optexity ist ein Open-Source-Projekt auf GitHub, das vom Optexity-Team entwickelt wurde. Sein Kern ist es, menschliche Demonstrationsdaten zu verwenden, um KI zu trainieren, um Computeraufgaben zu erledigen, insbesondere Webseitenoperationen. Das Projekt enthält drei Code-Bibliotheken: Compute...
vor 2 Monaten
05360
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: lokal trainierte KI-Doppelgänger mit persönlichen Erinnerungen und Gewohnheiten

Second Me ist ein Open-Source-Projekt, das vom Mindverse-Team entwickelt wurde und es Ihnen ermöglicht, eine KI auf Ihrem Computer zu erstellen, die wie ein "digitaler Doppelgänger" agiert, Ihre Sprachmuster und Gewohnheiten durch Ihre Worte und Erinnerungen lernt und zu einer intelligenten Person wird, die Sie versteht...
vor 2 Monaten
07180
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: Ein einfaches Tool zur Erstellung großer, fein abgestimmter Modelldatensätze

Umfassende Einführung Easy Dataset ist ein Open-Source-Tool, das speziell für die Feinabstimmung großer Modelle (LLMs) entwickelt wurde und auf GitHub gehostet wird. Es bietet eine einfach zu bedienende Benutzeroberfläche, die es Benutzern ermöglicht, Dateien hochzuladen, Inhalte automatisch zu segmentieren, Fragen und Antworten zu generieren und schließlich eine...
vor 2 Monaten
06790
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: Ein multimodales Reinforcement Learning Tool zur Erforschung des visuellen Denkens

Umfassende Einführung MM-EUREKA ist ein Open-Source-Projekt, das vom Shanghai Artificial Intelligence Laboratory der Shanghai Jiao Tong University und anderen Parteien entwickelt wurde. Es erweitert die Fähigkeiten des textuellen Reasonings auf multimodale Szenarien durch regelbasierte Reinforcement-Learning-Techniken, um Modelle bei der Verarbeitung von Bild- und Textinformationen zu unterstützen. Der Kern dieses Tools...
vor 3 Monaten
04750
X-R1:在普通设备中低成本训练0.5B模型

X-R1: Schulung von 0,5B-Modellen in gängigen Geräten zu geringen Kosten

Allgemeine Einführung X-R1 ist ein Reinforcement-Learning-Framework, das vom dhcode-cpp-Team auf GitHub zur Verfügung gestellt wird. Ziel ist es, Entwicklern ein kostengünstiges, effizientes Tool für das Training von Modellen auf Basis von End-to-End Reinforcement Learning zur Verfügung zu stellen. Das Projekt wird von DeepSeek unterstützt...
vor 3 Monaten
03840
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: Feinabstimmung großer Modelle zur Verbesserung der intelligenten Entscheidungsfindung im Körper

Allgemeine Einführung OpenManus-RL ist ein Open-Source-Projekt, das von UIUC-Ulab in Zusammenarbeit mit dem OpenManus-Team der MetaGPT-Community entwickelt wurde und auf GitHub gehostet wird. Das Projekt verbessert die großmaßstäbliche Sprachmodellierung (LLM) durch Techniken des Reinforcement Learning (RL)...
vor 3 Monaten
05300
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI: Ein KI-Framework, in das Sie Fragen eingeben können, um ein Modell in Echtzeit zu trainieren und die Ergebnisse auszugeben.

Allgemeine Einführung TPO-LLM-WebUI ist ein innovatives Projekt, das von Airmomo auf GitHub zur Verfügung gestellt wird und die Echtzeit-Optimierung von Large Language Models (LLMs) über eine intuitive Weboberfläche ermöglicht. Es verwendet TPO (Test-Time Pr...
vor 3 Monaten
05680
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: Open-Source-Plattform für großangelegtes Reasoning Reinforcement Learning Training

Allgemeine Einführung Open-Reasoner-Zero ist ein Open-Source-Projekt, das sich auf die Forschung im Bereich Reinforcement Learning (RL) konzentriert und vom Open-Reasoner-Zero-Team auf GitHub entwickelt wurde. Es zielt darauf ab, effizientes, skalierbares und einfach zu benutzendes Training zu bieten ...
vor 3 Monaten
05940
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Chinesischer Vollblut-DeepSeek-R1-Destillationsdatensatz, unterstützt chinesischen R1-Destillations-SFT-Datensatz

Umfassende Einführung Der chinesische DeepSeek-R1-Destillationsdatensatz ist ein chinesischer Open-Source-Datensatz mit 110.000 Daten, der zur Unterstützung der Forschung im Bereich des maschinellen Lernens und der Verarbeitung natürlicher Sprache entwickelt wurde. Der Datensatz wird vom NLP-Team von Cong Liu veröffentlicht und enthält nicht nur mathematische Daten, sondern auch eine große Anzahl allgemeiner...
vor 3 Monaten
06400
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: Effiziente Lösungen für das Training von KI-Modellen in großem Maßstab bereitstellen

Umfassende Einführung ColossalAI ist eine Open-Source-Plattform, die von HPC-AI Technologies entwickelt wurde, um eine effiziente und kostengünstige Lösung für das Training und die Inferenz umfangreicher KI-Modelle zu bieten. Durch die Unterstützung mehrerer paralleler Strategien, heterogener Speicherverwaltung und Training mit gemischter Präzision ist ColossalAI...
vor 3 Monaten
06020
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

Kiln: Einfaches LLM-Modell-Feinabstimmung und Datensynthesewerkzeug, 0-Code-Basis zur Feinabstimmung Ihrer eigenen Mini-Modelle!

Umfassende Einführung Kiln ist ein Open-Source-Tool, das sich auf die Feinabstimmung von Large Language Models (LLMs), die Erzeugung synthetischer Daten und die Zusammenarbeit von Datensätzen konzentriert. Es bietet intuitive Desktop-Anwendungen mit Unterstützung für Windows-, MacOS- und Linux-Systeme, mit denen Benutzer eine Null-Code-Implementierung von Ll...
vor 4 Monaten
09360