BrownChat: quelloffener Echtzeit-Sprachchat-KI-Assistent综合介绍 BrownChat 是一个基于大型语言模型(LLM)技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发,旨在通过先进的自然语言处理技术提升用户的沟通体验。B...Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produktevor 5 Monaten01K0
Xiaozhi AI Chatbot: Erstellen Sie Ihren AI-Chatbot-Begleiter, einfacher Sprachdialog und intelligente Interaktion综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实...Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produktevor 3 Monaten01.5K0
OpenAI Realtime API Next.js: eine Next.js-Vorlage für die Entwicklung von Echtzeit-KI-Anwendungen mit Sprachdialog综合介绍 OpenAI Realtime API Next.js 是一个基于Next.js框架的开源项目,旨在帮助开发者快速构建实时语音AI应用。该项目集成了OpenAI的实时API和WebRTC技术...Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produktevor 5 Monaten01K0
VITA: Open Source Multimodale Großsprachmodelle für visuelle und sprachliche Interaktion in Echtzeit综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produktevor 5 Monaten01.2K0
TransRouter: ein Echtzeit-Audio-Konvertierungstool für die Übersetzung vom Chinesischen ins Englische auf der Grundlage des multimodalen Gemini-Modells综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produktevor 5 Monaten09420
Fish Agent: End-to-End-KI-Stimmenklon-Assistent, Echtzeit-Sprachdialog-Assistent, Fish Speech-Spin-off-Projekt综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语...Neueste AI-Tools# AI Java Open Source Projekt# AI-Stimmenklonen# Multimodale interaktive Echtzeit-Produktevor 5 Monaten01K0
Megrez-3B-Omni: ein Modell für multimodales Verstehen auf der Endseite, das multimodales Verstehen und Analysieren von Text, Bild und Audio unterstützt综合介绍 Infini-Megrez是由无问芯穹(Infinigence AI)开发的边缘智能解决方案,旨在通过软硬件协同设计,实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型,支持图...Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produktevor 4 Monaten09360
Ichigo (llama3-s): lokaler Echtzeit-Sprachassistent, Open-Source-Version von Siri综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produktevor 5 Monaten01.3K0