LOADING

Sharenet
  • Praktische AI-Tutorials
  • AI-Utility-Befehle
  • Informationen zum Kurs
  • AI-Wissensdatenbank
  • AI-Antworten
  • Ich möchte einen Beitrag leisten
    • Top AI-Empfehlungen
    • Neueste AI-Tools
    • AI Artikel schreiben
    • AI-Bilderzeugung
    • AI-Video-Tools
    • AI Büro-Effizienz
    • AI-Programmierwerkzeuge
    • AI-Design-Tools
    • KI-Chat-Assistent
    • AI-Intelligenz

    Multimodale interaktive Produkte in Echtzeit

    Insgesamt 27 Artikel
    in Ordnung bringen
    BeitragUpdateüberfliegenAnerkennung
    Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

    Gemini Cursor: ein intelligenter KI-Desktop-Assistent, der auf Gemini aufbaut und sehen, hören und sprechen kann

    综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...
    Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produkte
    vor 4 Monaten
    07430
    xiaozhi-esp32-server:小智AI聊天机器人开源后端服务

    xiaozhi-esp32-server: Xiaozhi AI-Chatbot als quelloffener Backend-Dienst

    综合介绍 xiaozhi-esp32-server 是一个为 小智AI聊天机器人(xiaozhi-esp32)提供后端服务的工具。它用 Python 编写,基于 WebSocket 协议,帮助用户快速...
    Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produkte
    vor 3 Monaten
    07350
    Baichuan-Audio:支持实时语音交互的端到端音频模型

    Baichuan-Audio: ein End-to-End-Audiomodell, das Sprachinteraktion in Echtzeit unterstützt

    综合介绍 Baichuan-Audio 是由百川智能(baichuan-inc)开发的一个开源项目,托管于 GitHub 上,专注于端到端的语音交互技术。该项目提供了一个完整的音频处理框架,能够将语音...
    Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produkte
    vor 3 Monaten
    05520
    MoshiVis:实时语音对话和图像理解的开源模型

    MoshiVis: ein Open-Source-Modell für Sprachdialog und Bildverständnis in Echtzeit

    综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...
    Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produkte
    vor 2 Monaten
    04850
    VideoMind:视频按时间戳定位内容与问答的开源项目

    VideoMind: Video nach Zeitstempel Positionierung Inhalt und Q&A Open-Source-Projekt

    综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...
    Neueste AI-Tools# AI Java Open Source Projekt# KI-Tool zur Zusammenfassung von Text und Audio/Video# AI Audio-/Video-Editor
    vor 2 Monaten
    04770
    OpenAvatarChat:模块化设计的数字人对话工具

    OpenAvatarChat: ein modular aufgebautes Werkzeug für den digitalen menschlichen Dialog

    综合介绍 OpenAvatarChat 是由 HumanAIGC-Engineering 团队开发的一个开源项目,托管在 GitHub 上。它是一个模块化的数字人对话工具,用户可以在单台 PC 上运行...
    Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produkte
    vor 2 Monaten
    03920
    Stepsailor:在现有SaaS产品中集成AI命令栏

    Stepsailor: Integration von KI-Befehlsleisten in bestehende SaaS-Produkte

    综合介绍 Stepsailor 是一个专为开发者打造的工具,核心是一个 AI 命令栏。开发者可以用它让自己的软件产品听懂用户的话,比如用户说“添加新任务”,软件就自动执行。它通过简单的 SDK 集成到...
    Neueste AI-Tools# Professionelle Produktivitätswerkzeuge# Multimodale interaktive Echtzeit-Produkte
    vor 2 Monaten
    03220
    RealtimeVoiceChat:低延迟与AI进行自然口语对话

    RealtimeVoiceChat: natürlich gesprochener Dialog mit niedriger Latenz und KI

    综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回...
    Neueste AI-Tools# AI Java Open Source Projekt# Multimodale interaktive Echtzeit-Produkte
    vor 4 Wochen
    02840
    Das ist nicht alles.
    Sharenet
    Sharenet.ai, die beste und umfassendste KI-Lernanleitung und Tool-Navigation. Umarmen Sie gemeinsam die KI-Welle! Strg + D oder ⌘ + D Setzen Sie ein Lesezeichen für diese Seite in Ihre Browser-Lesezeichenleiste ❤️

    Friendly Link AnwendungErklärung über die Ablehnung oder Einschränkung der VerantwortungWerbekooperationenÜber uns

    Urheberrecht © 2025 Sharenet 
    de_DEDeutsch
    de_DEDeutschzh_CN简体中文 en_USEnglish ja日本語 ko_KR한국어 es_ESEspañol fr_FRFrançais pt_BRPortuguês do Brasil
    Schriftstücke
    SchriftstückeInternetadresseHardwareBuch