Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: Ein Open-Source-Tool für die Bearbeitung von Bildern mit Anweisungen in natürlicher Sprache

Allgemeine Einführung Step1X-Edit ist ein Open-Source-Framework zur Bildbearbeitung, das vom Stepfun AI-Team entwickelt wurde und auf GitHub gehostet wird. Es kombiniert ein multimodales großes Sprachmodell (Qwen-VL) und einen Diffusionstransformator (DiT), um es den Benutzern zu ermöglichen, Bilder durch ein einfaches und natu...
vor 3 Wochen
02440
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: MCP-Dienste zur Steuerung von CAD-Software durch natürlichsprachliche Befehle

Allgemeine Einführung CAD-MCP ist ein Open-Source-Projekt, das es Benutzern ermöglicht, CAD-Software durch natürlichsprachliche Befehle für Zeichenoperationen zu steuern. Es kombiniert die Verarbeitung natürlicher Sprache mit der CAD-Automatisierungstechnologie, so dass die Benutzer die CAD-Schnittstelle nicht manuell bedienen müssen, sondern nur einfache Textbefehle eingeben, die ...
vor 4 Wochen
02120
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: Feinabstimmung von Sprachmodellen mithilfe von Wissensgraphen zur Erzeugung synthetischer Daten

Umfassende Einführung GraphGen ist ein Open-Source-Framework, das von OpenScienceLab, einem KI-Labor in Shanghai, entwickelt wurde und auf GitHub gehostet wird. Es konzentriert sich auf die Optimierung der überwachten Feinabstimmung von Large Language Models (LLMs), indem es die Erzeugung synthetischer Daten durch Wissensgraphen anleitet. Es wurde entwickelt aus ...
vor 4 Wochen
01680
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: Open-Source-Audioverarbeitung und Dialogbasis-Modell

Allgemeine Einführung Kimi-Audio ist ein Open-Source-Audiobasismodell, das von Moonshot AI entwickelt wurde und sich auf Audioverstehen, -erzeugung und -dialog konzentriert. Es unterstützt eine breite Palette von Audioverarbeitungsaufgaben wie Spracherkennung, Audio-Q&A und Sprach-Emotionserkennung. Das Modell wurde über 130 Mal getestet...
vor 4 Wochen
02110