SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: ferramenta profissional de criação de ilustrações de mangá em quatro painéis, gerando imagens e editando páginas de mangá

综合介绍 SP-MangaEditer 是一个独立的漫画编辑平台,专为漫画创作者设计。该平台支持图像生成、图层编辑、图像调整、滤镜应用等多种功能,帮助用户轻松创建高质量的漫画插图。用户可以通过简单的操...
6 meses atrás
01.6K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: um projeto de código aberto para aprimorar a memória de longo prazo do agente usando gráficos de conhecimento

综合介绍 Memary 是一个创新的开源项目,专注于为自主智能体提供长期记忆管理解决方案。该项目通过知识图谱和专门的记忆模块,帮助智能体突破传统上下文窗口的限制,实现更智能的交互体验。Memary 采...
7 meses atrás
01.5K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: geração rápida de imagens de alta resolução, modelo de tamanho ultrapequeno de 0,6 B, operação de GPU de laptop de baixo perfil

综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著...
8 meses atrás
01.5K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: plataforma de produção de curso humano digital de código aberto, vídeo de palestra humana digital de clonagem de geração de PPT com um clique

综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...
9 meses atrás
01.5K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: implementação de código aberto do NotebookLM com base no Deepseek-V3 e no PlayHT TTS

Introdução geral O Open Source NotebookLM é um projeto inovador de inteligência artificial que combina os recursos de compreensão de linguagem do Deepseek-V3 com a tecnologia de síntese de fala do PlayHT, com o objetivo de criar um sistema inteligente de diálogo para anotações. O projeto foi desenvolvido pela Build Fast com...
7 meses atrás
01.5K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

Não estruturado: documentos não estruturados de pré-processamento de código aberto, ferramentas de processamento de dados não estruturados

综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LL...
11 meses atrás
01.5K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: reconhecimento automático de fala separado do alto-falante, fornecendo registros de tempo altamente precisos no nível da palavra

Introdução geral O BetterWhisperX é uma versão otimizada do projeto WhisperX, com foco no fornecimento de serviços de reconhecimento automático de fala (ASR) eficientes e precisos. Como um desdobramento aprimorado do WhisperX, o projeto foi desenvolvido por Federico ...
7 meses atrás
01.5K