Sharenet.ai

Day wölbt einen Bauern und teilt den König!
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)

1-2-1-MNVTON: Effiziente Bilder, virtuelle Anprobe von Kleidung durch Personen in Videos (noch zu öffnen)

Allgemeine Einführung 1-2-1-MNVTON ist ein GitHub-basiertes Open-Source-Projekt, das darauf abzielt, die Technologie "Modality-specific Normalization for Virtual Try-On" (MNVTON) durch...
vor 6 Monaten
01.3K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: Effizientes Text-to-Speech-Tool mit Unterstützung für mehrere Sprachen und Stimmen

Umfassende Einführung Kokoro-ONNX ist ein Open-Source-Tool für Text-to-Speech (TTS), das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle , zielt das Projekt darauf ab, effiziente und schnelle Sprachsyntheselösungen bereitzustellen.Kokoro-ONNX unterstützt ...
vor 6 Monaten
01.4K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell, hochpräzise OCR

Allgemeine Einführung Zerox ist ein Open-Source-Projekt, das entwickelt wurde, um PDF, DOCX, Bilder und andere Dokumente durch visuelle Modelle in das Markdown-Format zu konvertieren. Das Projekt wird vom getomni-ai Team entwickelt und bietet eine einfache und effiziente OCR (Optical Character Recognition) Lösung....
vor 6 Monaten
01.3K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: Video-Highlights automatisch bearbeiten, einfach professionelle Vlogs erstellen

Umfassende Einführung AIVLOG ist ein KI-Videobearbeitungstool, das für Vlog-Ersteller entwickelt wurde. Es kann Videoinhalte automatisch analysieren und auf intelligente Weise die Highlights herausschneiden, was dem Benutzer 95% Bearbeitungszeit erspart. Egal, ob es sich um ein Video des täglichen Lebens, Reiseberichte oder Gespräche handelt, AIVLOG kann...
vor 6 Monaten
01.2K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration in das Ollama-Backend

综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...
vor 6 Monaten
01.4K
Windsurf Wave 2 重大更新:引入网页搜索和自动化记忆功能,并提供企业级混合部署版本

Windsurf Wave 2 Major Update: Einführung von Websuche und automatisiertem Speicher mit Enterprise Hybrid Deployment Version

Codeium 近日推出 Windsurf Wave 2 更新,为开发者带来多项重要功能升级,包括 Web 搜索、自动化记忆和代码执行优化等。作为AI Coding工具Top 2,这些更新旨在为 20...
vor 6 Monaten
01.3K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

Google veröffentlicht die Vertex AI RAG-Engine: eine zentrale Anlaufstelle für die Entwicklung zuverlässiger generativer Anwendungen mit Suchfunktionen

生成式 AI 和大语言模型 (LLM) 正在改变各行各业,但两个关键挑战可能会阻碍企业采用:幻觉(生成不正确或无意义的信息)和超出其训练数据的有限知识。检索增强生成 (RAG) 和 grounding...
vor 6 Monaten
01K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Eine umfassende Einführung MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, eine gute RAG-Leistung auch für kleine Modelle durch heterogene Graphenindizierung und ein leichtgewichtiges topologieerweitertes Retrieval zu ermöglichen. Es wurde vom Data Science Laboratory der Universität von Hongkong (HKUDS) entwickelt, um ...
vor 6 Monaten
01.2K
Perplexity AI 提出与美国 TikTok 合并(收购)的竞标方案

Perplexity AI unterbreitet Angebot für Fusion (Übernahme) mit dem US-Unternehmen TikTok

要点: 据 CNBC 了解,Perplexity AI 上周六向 TikTok 的母公司字节跳动提交了一份竞标,提议 Perplexity 与 TikTok 美国业务合并。 一位熟悉情况的消息人士透露...
vor 6 Monaten
01K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: Ein multimodales Grand-Modell für das Verständnis von Bild- und Videoregionen zur Verbesserung der Analyse visueller Inhalte

综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...
vor 6 Monaten
01K