Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: Ein effizientes Web Crawling Tool für LLM Pre-Training

Umfassende Einführung Crawl4LLM ist ein Open-Source-Projekt, das gemeinsam von der Tsinghua University und der Carnegie Mellon University entwickelt wurde und sich auf die Optimierung der Effizienz des Web-Crawlings für das Pre-Training von großen Modellen (LLM) konzentriert. Es reduziert ineffektives Crawling durch intelligente Auswahl qualitativ hochwertiger Webdaten erheblich und behauptet, ursprünglich 1...
vor 4 Monaten
06350
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: Open-Source-Plattform für großangelegtes Reasoning Reinforcement Learning Training

Allgemeine Einführung Open-Reasoner-Zero ist ein Open-Source-Projekt, das sich auf die Forschung im Bereich Reinforcement Learning (RL) konzentriert und vom Open-Reasoner-Zero-Team auf GitHub entwickelt wurde. Es zielt darauf ab, effizientes, skalierbares und einfach zu benutzendes Training zu bieten ...
vor 4 Monaten
06570
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: eine Gruppenchat-App mit mehreren KI-Charakteren, die in Echtzeit interagieren

Allgemeine Einführung Botgroup.chat ist eine Open-Source-KI-Gruppen-Chat-Anwendung, die auf der Grundlage von React und Cloudflare Pages entwickelt wurde und darauf abzielt, den Benutzern ein interaktives Erlebnis ähnlich dem WeChat-Gruppen-Chat zu bieten. Es unterstützt die gleichzeitige Teilnahme von mehreren KI-Charakteren...
vor 4 Monaten
09180
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: ein Open-Source-Werkzeug zur automatischen Erstellung von Wissensgraphen aus einfachem Text

Allgemeine Einführung KGGen ist ein Open-Source-Tool, das vom Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab) entwickelt wurde und auf GitHub gehostet wird. Es dient der automatischen Generierung von Wissensgraphen aus beliebigen Texten. Es verwendet fortschrittliche Sprachmodellierungs- und Clustering-Algorithmen, um unstrukturierten Text...
vor 4 Monaten
09050
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: Leistungsstarke und einfach zu bedienende Software für das Facelifting und die Bearbeitung von Fotos und Videos

Allgemeine Einführung VisoMaster ist ein leistungsfähiges und einfach zu bedienendes Video-Gesichtstausch- und Bearbeitungswerkzeug, das künstliche Intelligenztechnologie verwendet, um natürliche und realistische Gesichtstauscheffekte zu erzielen. Egal, ob es sich um ein Bild oder ein Video handelt, VisoMaster kann mit einfachen Operationen hochwertige Face-Swap-Ergebnisse erzeugen, die...
vor 4 Monaten
01.5K0
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: dynamisches Werkzeug zur Erstellung von Wissensgraphen und zur Abfrage (zeitbewusstes Programm mit langem Speicher)

Allgemeine Einführung Graphiti ist ein von getzep entwickeltes Werkzeug zur Erstellung und Abfrage dynamischer, zeitabhängiger Wissensgraphen. Es ist in der Lage, komplexe und sich entwickelnde Beziehungen zwischen Entitäten zu repräsentieren und sie durch eine Vielzahl von Methoden abzufragen, wie z.B. temporale, Volltext-, semantische und Graphen-Algorithmen...
vor 4 Monaten
08070
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Chinesischer Vollblut-DeepSeek-R1-Destillationsdatensatz, unterstützt chinesischen R1-Destillations-SFT-Datensatz

Umfassende Einführung Der chinesische DeepSeek-R1-Destillationsdatensatz ist ein chinesischer Open-Source-Datensatz mit 110.000 Daten, der zur Unterstützung der Forschung im Bereich des maschinellen Lernens und der Verarbeitung natürlicher Sprache entwickelt wurde. Der Datensatz wird vom NLP-Team von Cong Liu veröffentlicht und enthält nicht nur mathematische Daten, sondern auch eine große Anzahl allgemeiner...
vor 4 Monaten
07040