Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: um macromodelo multimodal de áudio para diálogo de voz de ponta a ponta em tempo real, uma implementação de código aberto da interação de voz GPT-4o

Introdução abrangente O Ultravox é um inovador modelo multimodal de linguagem grande (LLM) projetado para processamento de fala em tempo real. Diferentemente dos sistemas tradicionais de reconhecimento de fala, o Ultravox elimina a necessidade de um estágio separado de reconhecimento de fala por áudio (ASR) e é capaz de converter diretamente o áudio em um espaço de alta dimensão...
6 meses atrás
01.3K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: um cliente Python que demonstra o processo de execução de um corpo inteligente, fornecendo uma interface gráfica de usuário intuitiva

综合介绍 AgentClientDemo 是一个集成了智能体(Agent)和客户端(Client)功能的综合性 Python 项目。该项目基于 PyQt 框架开发,提供了一个直观易用的图形用户界面(G...
6 meses atrás
0967
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: Arena de comparação de recursos de programação LLM de código aberto, visualização em tempo real dos melhores modelos de geração de código

综合介绍 CodeArena 是一个独特的平台,旨在通过实时对决展示最佳开源代码生成模型(LLM)。用户可以观看不同的LLM在相同的编程任务中竞争,并通过实时排行榜查看表现最佳的模型。该平台利用Tog...
6 meses atrás
01.2K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): copiloto nativo criado usando a API GPT, com suporte para diálogos complementares em qualquer janela.

Introdução geral O ChatFree é um projeto de código aberto que visa a liberar os aplicativos de IA dos usuários das restrições dos navegadores para serem executados localmente. Criado usando a API GPT, o Copilot foi projetado para oferecer suporte a uma ampla variedade de softwares de escritório, como Office, Word, WPS e outros. O projeto foi desenvolvido por ...
6 meses atrás
0958
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: gera esboços e desenhos de linha de alta qualidade, retropropaga palavras de sugestão de imagem, instalação de pacote com um clique

综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具,旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来,利用先进的机器学习模型,能...
6 meses atrás
01.2K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: estrutura de agente de vídeo inteligente para executar fluxos de trabalho de pesquisa, edição e geração de vídeo com descrições de linguagem natural

综合介绍 Director 是一个开源框架,旨在通过构建智能视频代理来简化和优化视频交互和工作流程。该框架基于 VideoDB 的“视频即数据”基础设施,能够处理复杂的视频任务,如搜索、编辑、编译和生...
6 meses atrás
01K