BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: reconhecimento automático de fala separado do alto-falante, fornecendo registros de tempo altamente precisos no nível da palavra

Introdução geral O BetterWhisperX é uma versão otimizada do projeto WhisperX, com foco no fornecimento de serviços de reconhecimento automático de fala (ASR) eficientes e precisos. Como um desdobramento aprimorado do WhisperX, o projeto foi desenvolvido por Federico ...
7 meses atrás
01.5K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: um macromodelo multimodal de áudio para diálogo de voz de ponta a ponta em tempo real, uma implementação de código aberto da interação de voz GPT-4o

Introdução abrangente O Ultravox é um inovador modelo multimodal de linguagem grande (LLM) projetado para processamento de fala em tempo real. Diferentemente dos sistemas tradicionais de reconhecimento de fala, o Ultravox elimina a necessidade de um estágio separado de reconhecimento de fala por áudio (ASR) e é capaz de converter diretamente o áudio em um espaço de alta dimensão...
8 meses atrás
01.5K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: uma estrutura de colaboração com várias inteligências para criar equipes de desenvolvimento de software de IA para programação de linguagem natural

Introdução abrangente O MetaGPT é uma estrutura inovadora de corpo de inteligência múltipla projetada para simular a operação de uma empresa de software de IA completa. Criado por geekan (Alexander Wu), o objetivo do projeto é combinar modelos GPT com diferentes funções em uma entidade colaborativa...
5 meses atrás
01.5K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica etc.

Introdução geral O MiniPerplx (renomeado como Scira) é um mecanismo de busca orientado por IA com design minimalista que integra uma variedade de recursos úteis para fornecer aos usuários uma gama completa de serviços de recuperação de informações. O projeto usa uma pilha de tecnologia moderna, incluindo Next.js, Tailwi...
6 meses atrás
01.5K