AI开源项目 - 第29页

in Ordnung bringen

Beitrag Update überfliegen Anerkennung

Midscene.js: ein Open-Source-Plugin, das Browser-Automatisierungstests mit KI unterstützt

综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具，能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本，简化了UI测...

vor 5 Monaten

01.2K

Video Analyzer: analysiert Videoinhalte und erstellt detaillierte Beschreibungen

Comprehensive Introduction Video Analyzer ist ein umfassendes Videoanalysetool, das Computer Vision, Audiotranskription und Techniken zur Verarbeitung natürlicher Sprache kombiniert, um detaillierte Beschreibungen von Videoinhalten zu erstellen. Das Tool transkribiert Audioinhalte, indem es Schlüsselbilder aus dem Video extrahiert...

Neueste AI-Tools # AI Java Open Source Projekt # Visuelle Zielerfassung

vor 4 Monaten

01.4K

Unsloth: ein Open-Source-Tool für die effiziente Feinabstimmung und das Training großer Sprachmodelle

Umfassende Einführung Unsloth ist ein Open-Source-Projekt, das effiziente Werkzeuge für die Feinabstimmung und das Training großer Sprachmodelle (LLMs) bereitstellt. Das Projekt unterstützt eine Vielzahl bekannter Modelle, darunter Llama, Mistral, Phi und Gemma...

Neueste AI-Tools # AI Java Open Source Projekt # Feinabstimmung des großen Modells

vor 4 Monaten

01.1K

MaxKB: Sofort einsatzbereites KI-Wissensdatenbank-Q&A-System für intelligenten Kundenservice und interne Wissensdatenbank

综合介绍 MaxKB（Max Knowledge Base）是一款基于大语言模型和RAG（检索增强生成）的开源知识库问答系统。该系统广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。MaxKB...

Neueste AI-Tools # AI Java Open Source Projekt # Wissensabfrage und RAG-Rahmen

vor 5 Monaten

01.1K

OmniThink：生成高质量长文的写作框架，搜索外部知识后反思并逐步构建知识树

OmniThink: ein Schreibrahmen für die Erstellung hochwertiger langer Aufsätze, die Suche nach externem Wissen und die anschließende Reflexion darüber sowie der schrittweise Aufbau eines Wissensbaums

Umfassende Einführung OmniThink ist ein innovatives Framework für maschinelles Schreiben, das entwickelt wurde, um qualitativ hochwertige Essays zu erstellen, indem es die iterative Erweiterung und Reflexion menschlicher kognitiver Prozesse nachahmt. OmniThink konzentriert sich darauf, die Grenzen des Wissens zu erweitern und Informationen zu generieren, die reichhaltig und tiefgründig...

Neueste AI-Tools # AI Schreiben # AI Java Open Source Projekt

vor 5 Monaten

0954

OpenAI Realtime Agents：多智能体语音交互应用（OpenAI示例）

OpenAI Realtime Agents: Eine multiintelligente Körper-Sprach-Interaktions-Anwendung (OpenAI-Beispiel)

综合介绍 OpenAI Realtime Agents是一个开源项目，旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式（借鉴 OpenAI Swarm），允许...

Neueste AI-Tools # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 5 Monaten

01.1K

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht

综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析（包括年龄、性别、情绪和种族）的Python库。它集成了多种先进的面部识别模型，如VGG-Face、FaceNet、OpenFace、De...

Neueste AI-Tools # AI Java Open Source Projekt

vor 5 Monaten

01.4K

SynthLight: Rendering von Porträtbildern mit natürlichem Licht (unveröffentlicht)

综合介绍 SynthLight 是一个基于扩散模型的肖像重光照工具。它通过学习重新渲染合成的人脸图像，实现对真实肖像照片的光照效果调整。该工具利用物理渲染引擎生成数据集，模拟不同光照条件下的光照转换...

Neueste AI-Tools # AI Image Style Control # AI Java Open Source Projekt

vor 5 Monaten

01.1K

1-2-1-MNVTON: Effiziente Bilder, virtuelle Anprobe von Kleidung durch Personen in Videos (noch zu öffnen)

Allgemeine Einführung 1-2-1-MNVTON ist ein GitHub-basiertes Open-Source-Projekt, das darauf abzielt, die Technologie "Modality-specific Normalization for Virtual Try-On" (MNVTON) durch...

Neueste AI-Tools # AI Java Open Source Projekt # AI Gesichtstausch und Verkleidung

vor 5 Monaten

01.1K

Kokoro-ONNX: Effizientes Text-to-Speech-Tool mit Unterstützung für mehrere Sprachen und Stimmen

Umfassende Einführung Kokoro-ONNX ist ein Open-Source-Tool für Text-to-Speech (TTS), das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle , zielt das Projekt darauf ab, effiziente und schnelle Sprachsyntheselösungen bereitzustellen.Kokoro-ONNX unterstützt ...

Neueste AI-Tools # AI Java Open Source Projekt # AI Text-to-Speech

vor 5 Monaten

01.2K

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell, hochpräzise OCR

Allgemeine Einführung Zerox ist ein Open-Source-Projekt, das entwickelt wurde, um PDF, DOCX, Bilder und andere Dokumente durch visuelle Modelle in das Markdown-Format zu konvertieren. Das Projekt wird vom getomni-ai Team entwickelt und bietet eine einfache und effiziente OCR (Optical Character Recognition) Lösung....

Neueste AI-Tools # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 5 Monaten

01.1K

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration in das Ollama-Backend

综合介绍 Charla 是一个基于终端的聊天应用程序，旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端，支持上下文感知的对话，并将聊天会话保存为 Markdown 文件。用户可以通过简...

Neueste AI-Tools # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 5 Monaten

01.2K

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Eine umfassende Einführung MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, eine gute RAG-Leistung auch für kleine Modelle durch heterogene Graphenindizierung und ein leichtgewichtiges topologieerweitertes Retrieval zu ermöglichen. Es wurde vom Data Science Laboratory der Universität von Hongkong (HKUDS) entwickelt, um ...

Neueste AI-Tools # AI Java Open Source Projekt # Wissensdiagramm # Wissensabfrage und RAG-Rahmen

vor 5 Monaten

01.1K

Omni-RGPT: Ein multimodales Grand-Modell für das Verständnis von Bild- und Videoregionen zur Verbesserung der Analyse visueller Inhalte

综合介绍 Omni-RGPT 是一个多模态大语言模型，旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术，Omni-RGPT 能够在视觉特征空间内高亮目标区域，并通过区域提示（如框或...

Neueste AI-Tools # AI Java Open Source Projekt

vor 5 Monaten

0886

Bailing: ein quelloffener Sprachdialogassistent mit niedriger Latenz für natürliche Konversation und Kommunikation

综合介绍百聆（Bailing）是一个开源的语音对话助手，旨在通过语音与用户进行自然的对话。该项目结合了语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术，实现了...

Neueste AI-Tools # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 5 Monaten

01.1K

Metaverse AI: Open-Source-Version des Tools zum digitalen Klonen von Menschen und zur Erstellung kurzer Videos

综合介绍元界AI（开源版）是一个托管在 GitHub 上的项目，，由 libn-net 团队开发。它能通过 AI 技术克隆数字人形象和声音，生成短视频，还支持配音和字幕制作。这个工具提供 Windo...

Neueste AI-Tools # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt # AI Digital Man

vor 3 Monaten

0526

WikiChat: ein Chat-Tool zum Abrufen von Wissen anhand von Wikipedia-Daten

综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人，旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型（如ChatGPT和GPT-4）在处理最新信息或不太流行的话题时，往往...

Neueste AI-Tools # AI Java Open Source Projekt # Wissensabfrage und RAG-Rahmen

vor 5 Monaten

0988

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: Freie Text-to-Speech-API mit Edge TTS, kompatibel mit OpenAI-Formaten

Allgemeine Einführung OpenAI Edge TTS ist ein Open-Source-Projekt, das eine native Text-to-Speech (TTS) API bereitstellt, die mit OpenAI kompatibel ist.

Neueste AI-Tools # AI Java Open Source Projekt # AI Text-to-Speech

vor 5 Monaten

01.4K