Marker:快速将PDF转换为Markdown的开源工具

Marker: herramientas de código abierto para convertir rápidamente PDF a Markdown

Introducción general Marker es una herramienta de procesamiento de documentos basada en aprendizaje profundo diseñada para convertir archivos PDF a formato Markdown de forma rápida y precisa. Es compatible con una amplia gama de tipos de documentos y está especialmente optimizado para la conversión de libros y artículos científicos.Marker es capaz de eliminar los encabezados...
hace 4 meses
01.8K
Mathpix:PDF和图片文档结构化转换软件,支持多终端

Mathpix: software de conversión estructurada de documentos PDF y de imagen, compatible con multiterminal

Descripción general Mathpix es una potente herramienta de automatización de documentos basada en IA diseñada para investigadores, desarrolladores y empresas. Convierte de forma rápida y precisa archivos PDF e imágenes en texto que se puede buscar, exportar y leer a máquina.Mathpix ofrece una amplia gama de funciones...
hace 10 meses
01.7K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: Haz Hablar a las Fotos | Audio Sincronizado con la Boca | Vídeo Sincronizado con la Boca Sintetizado | Gente Digital Gratis

Introducción general SadTalker es una herramienta de código abierto que combina una única foto de retrato estática con un archivo de audio para crear vídeos de avatares parlantes realistas para una amplia gama de escenarios, como mensajes personalizados, contenido educativo y mucho más. Utiliza de forma revolucionaria tecnologías de modelado 3D como ExpNet y PoseVA...
hace 5 meses
01.7K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: sistema de sincronización labial y edición de vídeo basado en audio

Introducción general VideoReTalking es un sistema innovador que permite al usuario generar vídeos faciales sincronizados con los labios a partir del audio de entrada, produciendo vídeos de salida de alta calidad y sincronizados con los labios incluso con diferentes emociones. El sistema divide este objetivo en tres tareas consecutivas: con expresiones típicas...
hace 7 meses
01.4K
聊多宝:网页中同时与多个大模型官方网页对话的浏览器插件

Chat Duo: Plugin de navegador para diálogos simultáneos con varias páginas web oficiales de modelos grandes en páginas web

Introducción general ChatHub es una extensión de navegador diseñada para integrarse con varias de las principales plataformas de chat de AI y ayudar a los usuarios a sincronizar chats multiplataforma en la misma interfaz. La herramienta no requiere que se proporcione una clave API, y los usuarios pueden empezar rápidamente con una sencilla instalación y configuración.ChatHu...
hace 5 meses
01.3K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Marco completo de generación de vídeo humano digital | Retrato a vídeo | Pose a vídeo | Sincronización de labios

Introducción general MuseV es un proyecto público en GitHub cuyo objetivo es la generación de vídeo avatar de longitud ilimitada y alta fidelidad. Se basa en la tecnología de difusión y proporciona Image2Video, Text2Image2Video, Video2Video...
hace 7 meses
01.6K
奇妙元:数字人视频制作与直播服务平台|声音克隆|形象克隆

WonderWon: Plataforma de servicios de producción de vídeo digital humano y retransmisión en directo|Clonación de voz|Clonación de imágenes

综合介绍 奇妙元是一个数字人视频制作与直播服务的平台,提供从照片、PPT生成视频的功能,以及视频的不同语言翻译服务。用户可以定制数字角色用于新闻报道、教育内容、企业推广等多个领域。平台还提供互动数字员...
hace 10 meses
01.3K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

No estructurados: preprocesamiento de documentos no estructurados de código abierto, herramientas de tratamiento de datos no estructurados

Introducción completa Unstructured-IO proporciona un conjunto de componentes de código abierto para el procesamiento y preprocesamiento de imágenes y documentos de texto como PDF, HTML, documentos de Word, etc. Su principal objetivo es simplificar y optimizar los flujos de trabajo de procesamiento de datos, especialmente para grandes modelos de lenguaje (LL...
hace 10 meses
01.4K