SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Selbstüberwachtes hierarchisches Make-up-Transfermodell, virtuelles Make-up, Migration von Make-up auf neue Porträts

Umfassende Einführung SHMT (Self-supervised Hierarchical Makeup Transfer) ist ein selbstüberwachtes hierarchisches Make-up-Migrationsprojekt, das auf einem latenten Diffusionsmodell basiert und darauf abzielt, eine hohe Qualität von Make-up-Effekten durch unüberwachte Lernmethoden zu erreichen...
vor 5 Monaten
01.1K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: Automatische Generierung und Übersetzung von mehrsprachigen Untertiteln für Videos mit Hilfe von KI

Allgemeine Einführung AI no jimaku gumi (AI no subtitle group) ist ein leistungsstarkes Kommandozeilen-Tool zur Verarbeitung von Videountertiteln, das sich auf die automatische Extraktion, Transkription und Übersetzung von Videountertiteln konzentriert. Das Tool integriert fortschrittliche KI-Technologien, einschließlich Whisper-Sprach...
vor 5 Monaten
01.1K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Open-Source-Implementierung von NotebookLM basierend auf Deepseek-V3 und PlayHT TTS

Allgemeine Einführung Open Source NotebookLM ist ein innovatives Projekt für künstliche Intelligenz, das die Sprachverstehensfähigkeiten von Deepseek-V3 mit der Sprachsynthesetechnologie von PlayHT kombiniert und darauf abzielt, ein intelligentes Dialogsystem für Notizen zu schaffen. Das Projekt wurde von Build Fast mit...
vor 5 Monaten
01.4K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: LLM-Reasoning-Dienst, der sich auf externe Echtzeit-Wissensgraphen-Daten stützt

Umfassende Einführung Diffbot LLM Reasoning Server ist ein innovatives, groß angelegtes Sprachmodellierungssystem mit speziellen Optimierungen und Verbesserungen auf Basis der LLama-Modellarchitektur. Das wichtigste Merkmal des Projekts ist die Integration von Echtzeit-Wissensgraphen mit Retrieval-gestützter Generierung...
vor 5 Monaten
01.3K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: End-to-End-KI-Stimmenklon-Assistent, Echtzeit-Sprachdialog-Assistent, Fish Speech-Spin-off-Projekt

Umfassende Einführung Fish Speech Derivative Project Fish Agent ist ein revolutionäres End-to-End-KI-Sprachklon-System, das auf der Grundlage der 3B-Modellarchitektur V0.1 entwickelt wurde. Als ein vollständig durchgängiges Sprachklon-Verarbeitungssystem ist sein wichtigstes Merkmal die Verwendung innovativer sprachloser...
vor 6 Monaten
01.1K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: Intelligente Bearbeitung von Videoinhalten zu Kurzfilmen, einfaches und genaues Extrahieren/Zuschneiden von Videoclips

Umfassende Einführung FunClip ist ein vollständig quelloffenes, lokalisiertes, automatisiertes Videobearbeitungswerkzeug, das vom TONGYI Speech Lab des Alibaba Dharma Institute entwickelt wurde. Das Tool integriert das industrietaugliche Paraformer-Large-Spracherkennungsmodell, das die Sprache im Video genau identifizieren kann...
vor 6 Monaten
01.1K