Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: uma estrutura de interação de voz multimodal que reconhece a fala e se comunica usando a fala clonada, entre outros recursos

综合介绍 Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川...
5 meses atrás
01.4K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI: projeto de navegação de ferramenta de IA leve e de código aberto

Introdução abrangente O Tap4 AI WebUI é um projeto de site de navegação de ferramentas de IA leve e de código aberto, projetado para ajudar os usuários a criar facilmente seu próprio catálogo de ferramentas de IA. O projeto usa o Next.js e a pilha de tecnologia Supabase, com suporte para otimização de SEO em vários idiomas, para fornecer...
9 meses atrás
01.4K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: base de conhecimento conversacional baseada em GraphRAG/ferramenta de pesquisa profunda na Web com diálogos que podem ser integrados a outros sites

Introdução geral O AutoFlow é uma ferramenta de código aberto desenvolvida pela PingCAP para criar bases de conhecimento baseadas em gráficos com armazenamento vetorial sem servidor TiDB. Ele integra as estruturas LlamaIndex e DSPy para oferecer suporte à pesquisa de diálogos complexos e ao gráfico de conhecimento...
6 meses atrás
01.4K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreamento de desenhos animados, sombreamento automático de imagens em preto e branco para melhorar a consistência e a qualidade da cor da imagem

综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具,旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道,通过参考图像池准确生成各种元素的颜色,包括角色的头发颜色和服...
7 meses atrás
01.4K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: gera esboços e desenhos de linha de alta qualidade, retropropaga palavras de sugestão de imagem, instalação de pacote com um clique

综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具,旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来,利用先进的机器学习模型,能...
8 meses atrás
01.4K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: ferramenta interativa de edição de imagens, controle de apontar e clicar e arrastar e soltar a posição da imagem

Introdução geral DragGAN é uma ferramenta interativa de edição de imagens baseada em redes adversárias generativas (GAN). Ela foi lançada por Xingang Pan et al. na SIGGRAPH 2023 e tem como objetivo permitir que os usuários manipulem intuitivamente por meio de operações simples de apontar e clicar e arrastar e soltar...
8 meses atrás
01.4K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: Fluxos de trabalho corporais inteligentes de criação de linguagem natural para automação de desktops e navegadores

综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...
5 meses atrás
01.4K