Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala
综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...
Libra: um cliente para gerar inteligências de IA locais com diálogo (teste interno)
Introdução geral O Libra é uma ferramenta inovadora da Greenbit.ai cuja função principal é gerar inteligências de IA que são executadas localmente por meio do diálogo em linguagem natural. Chamado de "Vibe Agent", ele permite que os usuários descrevam suas necessidades em termos simples e criem rapidamente...
VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas
综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...
SuperCoder: assistente de código inteligente para execução em terminal de linha de comando
Introdução geral O SuperCoder é uma ferramenta inteligente que é executada no terminal e foi projetada para programadores. Ela usa a tecnologia de IA para ajudar os usuários a pesquisar códigos, visualizar a estrutura do projeto, editar arquivos e corrigir bugs.
Emigo: um assistente para tarefas de programação complexas usando IA no Emacs
Introdução geral O Emigo é um assistente de programação de IA de código aberto projetado para o Emacs, desenvolvido por MatthewZMD no GitHub. Ele ajuda os programadores a concluir a análise de código no Emacs, integrando um modelo de linguagem em grande escala (LLM)...
SegAnyMo: uma ferramenta de código aberto para segmentar automaticamente objetos móveis arbitrários em vídeos
Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou...
ChatGPT gera palavras-chave de comparação de estilo duplo de retrato
提示词 A dramatic, front-facing close-up portrait of Hayao Miyazaki. The composition is perfectly symme...
Quando o Gemini 2.5 encontra o Three.js, a solução para ensinar animação de demonstração está completa!
Three.js 就是一个让网页能显示“立体”图像的工具。你可以把它想象成: 它提供了一套工具,让开发者可以在网页上画出各种 3D 的形状,比如立方体、球体等等。 它还能让这些 3D 形状动起来,实现...
GeminiCode: um assistente de programação de IA baseado no Gemini 2.5 em execução em terminais
Introdução geral O GeminiCode é um assistente de programação de IA executado em um terminal, desenvolvido por desenvolvedores em seu tempo livre nos fins de semana. Ele é baseado no modelo Gemini 2.5 Pro do Google e pode ler e modificar arquivos no diretório atual do seu computador. Esse...
GenXD: estrutura de código aberto para gerar vídeos de cenas arbitrárias em 3D e 4D
综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...