Projetos de código aberto de IA - Página 34

organizar em ordem

postagem atualização passar por cima elogios

Omni-RGPT: um grande modelo multimodal para compreensão em nível de região de imagens e vídeos para aprimorar a análise de conteúdo visual

综合介绍 Omni-RGPT 是一个多模态大语言模型，旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术，Omni-RGPT 能够在视觉特征空间内高亮目标区域，并通过区域提示（如框或...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java

5 meses atrás

0894

Megrez-3B-Omni：端侧多模态理解模型，支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: um modelo de compreensão multimodal do lado final que oferece suporte à compreensão e análise multimodal de texto, imagem e áudio

综合介绍 Infini-Megrez是由无问芯穹（Infinigence AI）开发的边缘智能解决方案，旨在通过软硬件协同设计，实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型，支持图...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Produtos multimodais interativos em tempo real

5 meses atrás

01K

Bailing: um assistente de diálogo de voz de código aberto de baixa latência para conversação e comunicação naturais

综合介绍百聆（Bailing）是一个开源的语音对话助手，旨在通过语音与用户进行自然的对话。该项目结合了语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术，实现了...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Produtos multimodais interativos em tempo real

5 meses atrás

01.1K

WikiChat: uma ferramenta de bate-papo para recuperar conhecimento usando dados da Wikipédia

Introdução geral O WikiChat é um chatbot experimental desenvolvido na Universidade de Stanford com o objetivo de aprimorar a factualidade de modelos de linguagem grandes recuperando dados da Wikipédia. Os grandes modelos de linguagem (como o ChatGPT e o GPT-4) tendem a processar informações atualizadas ou tópicos menos populares quando...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Recuperação de conhecimento e estrutura RAG

5 meses atrás

0999

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

综合介绍 OpenAI Edge TTS 是一个开源项目，提供与 OpenAI 兼容的本地文本转语音（TTS）API。该项目使用 Microsoft Edge 的在线文本转语音服务，允许用户生成高质量...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Conversão de texto em fala com IA

5 meses atrás

01.4K

AIEvo: uma estrutura eficiente para a criação de aplicativos colaborativos multiinteligentes

综合介绍 AIEvo是蚂蚁集团开源的多代理框架，旨在高效创建多代理应用。该框架严格遵循SOP任务图，提升复杂任务的执行成功率，并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java Estrutura de desenvolvimento do corpo inteligente #

5 meses atrás

0978

MangaNinjia: uma ferramenta automatizada de coloração de linhas para colorir rapidamente desenhos de anime em preto e branco.

综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室（Ali-Vilab）开发的一个开源项目，专注于线稿上色的自动化处理。这一工具通过深度学习技术，实现了对参考图像的精确色彩匹配，极大地提高...

Ferramentas de IA mais recentes # Controle de estilo de imagem AI # Projeto de código aberto AI Java

5 meses atrás

01.2K

PPTAgent: geração e avaliação automáticas de apresentações PPT, documentos para PPTs

综合介绍 PPTAgent是一个创新的系统，旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法，采用两步流程确保内容质量和视觉效果。此外，PPTAgent还引入了PPTEval，一个全面...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Apresentação/PPT gerada por IA

5 meses atrás

0978

FlowiseAI: criação de uma interface de arrastar e soltar nós para aplicativos LLM personalizados

综合介绍 FlowiseAI 是一个开源的低代码工具，旨在帮助开发者构建自定义的LLM（大语言模型）应用和AI代理。通过简单的拖放界面，用户可以快速创建和迭代LLM应用，从测试到生产的过程变得更加高效...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Fluxo de trabalho com pouco código

5 meses atrás

01.3K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper

Introdução geral O RealtimeSTT é uma biblioteca de conversão de fala em texto eficiente e de baixa latência em tempo real, com detecção avançada de atividade de fala e ativação de palavras de alerta. Ela foi desenvolvida por Kolja Beigel para dar suporte a aplicativos que exigem conversão de fala em texto rápida e precisa...

Notícias sobre IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

01.3K

ALog: aplicativo portátil de diário de voz com IA e suporte de fala para texto.

综合介绍 ALog 是一个基于人工智能的语音日记应用，旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发，并在 GitHub 上开源。用户可以通过语音输入记录日记，应用会自动将语音转换为文...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

01.5K

SemHash: implementação rápida de desduplicação de texto semântico para melhorar a eficiência da limpeza de dados

综合介绍 SemHash 是一个轻量级且灵活的工具，用于通过语义相似性来去重数据集。它结合了 Model2Vec 的快速嵌入生成和 Vicinity 的高效 ANN（近似最近邻）相似性搜索。SemHa...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Extração e limpeza de documentos

5 meses atrás

01K

Cognita: uma estrutura de código aberto para criar aplicativos RAG modulares e testar rapidamente diversas estratégias RAG

Introdução abrangente A Cognita é uma estrutura de código aberto desenvolvida pela TrueFoundry para simplificar o desenvolvimento de aplicativos baseados em RAG (Retrieval-Augmented Generation). A estrutura fornece um sistema estruturado, mod...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Sem desenvolvimento de código # Recuperação de conhecimento e estrutura RAG

5 meses atrás

0984