Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, una plataforma para construir modelos base de IA del mundo físico.

Introducción completa NVIDIA Cosmos es una plataforma de modelado basada en mundos para desarrolladores, diseñada específicamente para ayudar a los desarrolladores de IA de física a crear sus sistemas de IA de física mejor y más rápido. La plataforma ofrece una amplia gama de modelos preentrenados, incluidos modelos de difusión y autorregresivos...
hace 5 meses
01.1K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Modelo de transferencia de maquillaje jerárquico autosupervisado, maquillaje virtual, migración del maquillaje a nuevos retratos.

Introducción exhaustiva SHMT (Self-supervised Hierarchical Makeup Transfer) es un proyecto de migración de maquillaje jerárquico autosupervisado basado en un modelo de difusión latente, cuyo objetivo es lograr una alta calidad de los efectos de maquillaje mediante métodos de aprendizaje no supervisados....
hace 5 meses
01.1K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Buscador de tendencias: seguimiento de las tendencias en las redes sociales, los temas de moda y los nuevos artículos en tiempo real para la toma de decisiones de marketing.

综合介绍 Trend Finder 是一个强大的工具,旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子,Trend Finder 能够在检测到新趋势或产品发布时,及时发送...
hace 5 meses
01.2K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter: una herramienta de conversión de audio en tiempo real para la traducción del chino al inglés basada en el modelo multimodal Gemini.

综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...
hace 5 meses
01K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Vision is All You Need: Building an Intelligent Document Retrieval System Using Visual Language Models (Visión RAG)

综合介绍 Vision-is-all-you-need 是一个创新的视觉RAG(检索增强生成)系统演示项目,它突破性地将视觉语言模型(VLM)应用于文档处理领域。不同于传统的文本分块方法,该系统直接使...
hace 5 meses
0993