Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: proyecto de código abierto de generación eficiente de vídeo que pretende generar un vídeo de un minuto en menos de un minuto.

Introducción exhaustiva Magic 1-For-1 es un modelo eficiente de generación de vídeo diseñado para optimizar el uso de memoria y reducir la latencia de inferencia. El modelo descompone la tarea de generación de texto a vídeo en dos subtareas: generación de texto a imagen y generación de imagen a vídeo, lo que permite un entrenamiento y una destilación más eficientes....
hace 6 meses
01K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG: Herramienta de chat inteligente para apoyar las preguntas y respuestas sobre documentos PDF locales de múltiples fuentes

综合介绍 LocalPdfChatRAG是一个开源项目,旨在通过结合本地PDF文档和检索增强生成(RAG)模型,实现智能聊天功能。该项目允许用户上传PDF文档,并通过自然语言提问的方式,从文档中获取相...
hace 6 meses
0886
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: Genera vídeos detallados y coherentes, ideales para crear vídeos publicitarios con personajes y objetos detallados.

Introducción exhaustiva Goku es un modelo federado de generación de imágenes y vídeos basado en técnicas de transformación de flujos y diseñado para alcanzar un rendimiento de nivel industrial. Integra técnicas avanzadas de generación visual de alta calidad, como la recopilación de datos detallados, el diseño de modelos y la formulación de transformaciones de flujo.
hace 6 meses
01.1K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor: un asistente inteligente de sobremesa basado en Gemini que puede ver, oír y hablar.

Introducción general Gemini Cursor es un asistente inteligente de escritorio basado en el modelo Gemini 2.0 Flash (experimental) de Google. Permite interacciones visuales, auditivas y de voz a través de una API multimodal, proporcionando un uso en tiempo real de baja latencia....
hace 6 meses
01.6K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: una aplicación de IA para iOS de código abierto basada en modelos OLMoE que funcionan sin conexión.

Introducción general Ai2 OLMoE es una aplicación iOS de código abierto desarrollada por el Allen Institute for AI (Ai2, Instituto Allen de Inteligencia Artificial) para proporcionar modelos de IA que se ejecutan íntegramente en dispositivos. La aplicación aprovecha el código abie...
hace 6 meses
0999
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: un modelo de lenguaje visual experto para la comprensión multimodal avanzada

Introducción exhaustiva DeepSeek-VL2 es una serie de modelos avanzados de lenguaje visual Mixture-of-Experts (MoE) que mejoran significativamente el rendimiento de su predecesor, DeepSeek-VL. Los modelos son útiles en preguntas y respuestas visuales, reconocimiento óptico de caracteres,...
hace 6 meses
01.3K