RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实...
hace 6 meses
01.8K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: analiza cada tipo de documento en datos disponibles en LLM, conservando toda la información del documento, como tablas e imágenes, en su totalidad.

Introducción general MegaParse es una potente y versátil herramienta de análisis sintáctico de documentos diseñada para optimizar el procesamiento de datos para el Large Language Model (LLM). Tanto si trabaja con texto, PDF, presentaciones de PowerPoint o documentos de Word, MegaParse...
hace 8 meses
01.8K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: una herramienta automatizada de I+D basada en datos que facilita los procesos de I+D basados en datos mediante tecnología de IA.

综合介绍 RD-Agent是由微软推出的一款开源工具,旨在自动化和优化研究与开发(R&D)过程。该工具专注于数据驱动的场景,通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...
hace 4 meses
01.8K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: Haz Hablar a las Fotos | Audio Sincronizado con la Boca | Vídeo Sincronizado con la Boca Sintetizado | Gente Digital Gratis

Introducción general SadTalker es una herramienta de código abierto que combina una única foto de retrato estática con un archivo de audio para crear vídeos de avatares parlantes realistas para una amplia gama de escenarios, como mensajes personalizados, contenido educativo y mucho más. Utiliza de forma revolucionaria tecnologías de modelado 3D como ExpNet y PoseVA...
hace 5 meses
01.7K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: restauración facial de imágenes y vídeos, restauración de fotos antiguas, ofrece una versión de despliegue con un solo clic

CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库,由南洋理工大学 S-Lab 的研究团队开发,并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器(C...
hace 10 meses
01.7K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código abierto para la eliminación por lotes de fondos de imágenes y vídeos, optimizado para RMBG 2.0

Introducción general RMBG-2-Studio es una aplicación mejorada de eliminación y sustitución de fondos desarrollada sobre la base del modelo BRIA-RMBG-2.0. La aplicación está diseñada para proporcionar a los usuarios capacidades de procesamiento de fondo de imagen eficientes y precisas para una variedad de tipos de imágenes, incluyendo comercio electrónico, juegos y...
hace 8 meses
01.7K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Marco completo de generación de vídeo humano digital | Retrato a vídeo | Pose a vídeo | Sincronización de labios

Introducción general MuseV es un proyecto público en GitHub cuyo objetivo es la generación de vídeo avatar de longitud ilimitada y alta fidelidad. Se basa en la tecnología de difusión y proporciona Image2Video, Text2Image2Video, Video2Video...
hace 7 meses
01.7K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: herramienta para la sincronización labial de vídeo de alta calidad, optimizada para Wav2Lip

Introducción general Easy-Wav2Lip es una herramienta mejorada basada en Wav2Lip diseñada para simplificar el proceso de sincronización labial de vídeo. La herramienta ofrece una configuración e implementación más sencillas con soporte para Google Colab e instalación local. Mediante la optimización del algoritmo, Ea...
hace 7 meses
01.7K