Gemini Cursor: um assistente inteligente de desktop com IA baseado no Gemini que pode ver, ouvir e falar综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...Ferramentas de IA mais recentes# Projeto de código aberto AI Java# Produtos multimodais interativos em tempo real4 meses atrás07370
xiaozhi-esp32-server: serviço de back-end de código aberto do chatbot de IA da Xiaozhi综合介绍 xiaozhi-esp32-server 是一个为 小智AI聊天机器人(xiaozhi-esp32)提供后端服务的工具。它用 Python 编写,基于 WebSocket 协议,帮助用户快速...Ferramentas de IA mais recentes# Projeto de código aberto AI Java# Produtos multimodais interativos em tempo real3 meses atrás07300
Baichuan-Audio: um modelo de áudio de ponta a ponta que oferece suporte à interação de voz em tempo real综合介绍 Baichuan-Audio 是由百川智能(baichuan-inc)开发的一个开源项目,托管于 GitHub 上,专注于端到端的语音交互技术。该项目提供了一个完整的音频处理框架,能够将语音...Ferramentas de IA mais recentes# Projeto de código aberto AI Java# Produtos multimodais interativos em tempo real3 meses atrás05460
MoshiVis: um modelo de código aberto para diálogo de fala em tempo real e compreensão de imagens综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...Ferramentas de IA mais recentes# Projeto de código aberto AI Java# Produtos multimodais interativos em tempo real2 meses atrás04810
VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...Ferramentas de IA mais recentes# Projeto de código aberto AI Java# Ferramenta de resumo de texto e áudio/vídeo com IAEditor de áudio/vídeo # AI2 meses atrás04690
OpenAvatarChat: uma ferramenta de diálogo humano digital projetada de forma modular综合介绍 OpenAvatarChat 是由 HumanAIGC-Engineering 团队开发的一个开源项目,托管在 GitHub 上。它是一个模块化的数字人对话工具,用户可以在单台 PC 上运行...Ferramentas de IA mais recentes# Projeto de código aberto AI Java# Produtos multimodais interativos em tempo real2 meses atrás03890
Stepsailor: integração de barras de comando de IA em produtos SaaS existentes综合介绍 Stepsailor 是一个专为开发者打造的工具,核心是一个 AI 命令栏。开发者可以用它让自己的软件产品听懂用户的话,比如用户说“添加新任务”,软件就自动执行。它通过简单的 SDK 集成到...Ferramentas de IA mais recentes# Ferramentas de produtividade profissional# Produtos multimodais interativos em tempo real2 meses atrás03160
RealtimeVoiceChat: diálogo falado natural de baixa latência com IA综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回...Ferramentas de IA mais recentes# Projeto de código aberto AI Java# Produtos multimodais interativos em tempo real4 semanas atrás02780