Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: Mehrsprachiges, samplefreies Tool zum Klonen von Stimmen basierend auf xtts_v2 für Windows.

Allgemeine Beschreibung Clone Voice ist ein Open-Source-Tool zum Klonen von Klängen, das eine webbasierte Schnittstelle bietet, mit der Benutzer Stimmen klonen können, indem sie beliebige Klänge oder persönliche Sprachaufnahmen verwenden. Das Tool ist einfach zu bedienen, auch ohne NVIDIA GPU, und kann mit einer vorkompilierten App verwendet werden...
vor 8 Monaten
01.4K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

Retrieval-basierte Sprachumwandlung WebUI: Ein Rahmenwerk für Retrieval-basierte Sprachumwandlung | Simulation realer Gesangsstimmen

Comprehensive Introduction Retrieval based Voice Conversion WebUI ist ein einfach zu bedienendes VITS-basiertes Sprachkonvertierungs-Framework, das die Sprachkonvertierung zwischen beliebigen Sprechern ermöglicht, einschließlich Song-Covers und Stimmänderungen in Echtzeit. Es hat niedrige ...
vor 9 Monaten
01.4K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: Open-Source-Null-Sample-Sprachklonierung und Text-to-Speech-Tool

Umfassende Einführung VoiceCraft ist ein Open-Source-Sprachbearbeitungs- und Null-Sample-Sprachsynthese-Tool, das auf dem neuronalen Codec-Sprachmodell basiert. Es verwendet eine innovative Methode zur Generierung kodierter Sequenzen, die das Einfügen, Löschen und Ersetzen bestehender Sprachsequenzen ermöglicht, um natürliche, kohärent bearbeitete Sprache zu erzeugen...
vor 9 Monaten
01.4K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: Lokale Echtzeit-Chat-Anwendung UI basierend auf Nuxt 3 und Ollama

Umfassende Einführung ChatOllama ist ein Open-Source-Online-Chat-Anwendungsprojekt auf der Grundlage eines groß angelegten Sprachmodells (LLM), das zahlreiche Sprachmodelle und die Verwaltung der Wissensbasis unterstützt. Benutzer können die Plattform für die Modellverwaltung (Listenanzeige, Download, Löschen), den Chat mit Modellen und andere Funktionen nutzen. Das Projekt verwendet ...
vor 9 Monaten
01.2K
OpenSPG:开源知识图谱引擎

OpenSPG: Open-Source-Wissensgraphen-Engine

Umfassende Einführung OpenSPG ist eine Open-Source-Wissensgraphen-Engine, die von der Ant Group in Zusammenarbeit mit OpenKG entwickelt wurde und auf dem SPG-Framework (Semantic Augmented Programmable Graph) basiert. Die Engine wurde entwickelt, um Funktionen wie explizite semantische Repräsentation, logische Regeldefinition und einen operativen Rahmen zur Unterstützung der Konstruktion und Verwaltung von Wissensgraphen zu bieten...
vor 9 Monaten
01.8K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon: ein einfach zu verwendendes Open-Source-Werkzeug für multimodale Dokumentenquizs

Allgemeine Einführung Kotaemon ist ein quelloffenes Q&A-Tool für Dokumente, das Endbenutzern und Entwicklern Q&A-Funktionen auf der Grundlage von Retrieval Augmented Generation (RAG) bietet. Das Projekt wurde von Cinnamon entwickelt und unterstützt eine Vielzahl von LLM-API-Anbietern (z.B. OpenA...
vor 9 Monaten
01.7K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: Bild- und Video-Gesichtsrestaurierung, Wiederherstellung alter Fotos, bietet eine Ein-Klick-Bereitstellungsversion

CodeFormer Allgemeine Einführung CodeFormer ist eine Codebasis für die robuste blinde Gesichtsreparatur, die von einem Forscherteam am S-Lab der Nanyang Technological University entwickelt und auf der NeurIPS 2022 vorgestellt wurde. Das Projekt nutzt einen Codebook Lookup Transformer (C...
vor 9 Monaten
01.6K