DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: Interaktives Bildbearbeitungswerkzeug, Steuerung der Bildposition durch Zeigen und Klicken sowie Ziehen und Ablegen

Allgemeine Einführung DragGAN ist ein interaktives Bildbearbeitungstool, das auf Generative Adversarial Networks (GAN) basiert. Es wurde von Xingang Pan et al. auf der SIGGRAPH 2023 vorgestellt und zielt darauf ab, Benutzern eine intuitive Manipulation durch einfaches Zeigen und Klicken sowie Ziehen und Ablegen zu ermöglichen...
vor 6 Monaten
01.2K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ein auf Qwen basierendes Framework für intelligente Agentenanwendungen, einschließlich Tool-Aufrufen, Code-Interpretern, RAGs und Chrome-Erweiterungen.

Umfassende Einführung Qwen-Agent ist ein intelligentes Agenten-Anwendungs-Framework, das auf der Grundlage von Qwen 2.0 und höher entwickelt wurde und über Fähigkeiten wie Befehlsverfolgung, Werkzeugnutzung, Planung und Speicher verfügt. Das Framework bietet eine Vielzahl von Beispielanwendungen wie Browser-Assistenten, Code-Interpreter und benutzerdefinierte Assistenten...
vor 6 Monaten
01.1K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: ein Online-Cover-Maker, mit dem Sie personalisierte Cover für Blogs, Kurzvideos, soziale Medien und vieles mehr erstellen können!

Allgemeine Einführung Mini-Cover ist ein Open-Source-Online-Tool zur Erstellung von Covers für Plattformen wie Blogs, Kurzvideos und soziale Medien. Das von JLinMr entwickelte Tool zielt darauf ab, eine einfache und effiziente Lösung zu bieten, mit der Benutzer schnell Cover erstellen können, die ihren Bedürfnissen entsprechen...
vor 6 Monaten
0941
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: ein multimodales Audiomakromodell für einen End-to-End-Sprachdialog in Echtzeit, eine Open-Source-Implementierung der GPT-4o-Sprachinteraktion

综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...
vor 6 Monaten
01.3K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: Web-Recherche und Berichtserstellung unter Verwendung des nativen LLM, das automatisch in benutzerdefinierte Themen eindringt und Zusammenfassungen erstellt.

综合介绍 Research Rabbit 是一个基于本地LLM(大语言模型)的网页研究和总结助手。用户提供研究主题后,Research Rabbit 会生成搜索查询,获取相关网页结果,并总结这些结果...
vor 3 Monaten
01.1K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: ein All-in-One-Dienst, der visuelle Modelle für die Aufnahme von Dokumenten und intelligentes Chunking auf der Grundlage von Textabsatzhierarchien verwendet

Allgemeine Einführung Chunkr ist eine selbst gehostete API zur Konvertierung von PDF-, PPTX-, DOCX- und Excel-Dateien in Daten, die für die Verwendung in RAG (Retrieval Augmented Generation) und LLM (Large Language Modelling) geeignet sind. Das Projekt wurde von Lumina entwickelt...
vor 6 Monaten
01.2K