DeepSeek publica la primera versión de código abierto de su modelo v3, ahora con la mayor capacidad de código (en China)
DeepSeek-V3 es un potente modelo lingüístico de Mezcla de Expertos (MoE) con 671.000 millones de parámetros totales y 3.700 millones de parámetros activados para cada token. El modelo emplea una innovadora atención potencial multicabezal (Mu...
CogAgent: modelo de lenguaje visual inteligente de código abierto de Smart Spectrum para la automatización de interfaces gráficas
综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...
Plataforma de creación de vídeo "Searchlight" del Instituto Dharma Reseña completa
Hoy temprano, recibí una notificación de que mi solicitud para pruebas internas de "Searchlight" fue aprobada, así que publicaré una breve reseña antes de irme a la cama. La plataforma se posiciona como la "plataforma de aplicaciones de capacidad de tecnología visual" del Instituto Dharma, y actualmente hay menos aplicaciones (en comparación con el lanzamiento), esperando abrir gradualmente más aplicaciones visuales. La búsqueda de la luz se divide en dos direcciones: https...
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐
综合介绍 DisPose是一个创新的开源人工智能项目,专注于可控的人物图像动画生成。该项目由研究团队开发并在GitHub上开源,采用先进的深度学习技术,通过分解骨骼姿态信息来实现精确的人物动画控制。D...
Smolagents:快速开发AI智能体,轻量级构建智能体的开源项目
综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...
通过视觉提取文档为Markdown格式文档的组合提示词指令
该指令来源于 Vision Parse 项目,分为两步提取markdown文档。 图像分析提示词 (img_analysis.prompt): Analyze this image and retur...
Napkin AI 中文入门指南
如何开始使用 Napkin AI 生成视觉内容 ?(账户创建、视觉生成、导出为 pdf 或图像文件...) 欢迎使用 Napkin AI,这款工具可以轻松地将您的文本转换为精美的视觉效果。本指南将引导...
Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual
综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...
InvSR: Proyecto de superresolución de imágenes de código abierto para mejorar la calidad de la resolución de imágenes.
综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...
Infinity: modelización autorregresiva por bits de la generación de imágenes de alta resolución para una generación ilimitada de imágenes de alta resolución
Introducción general Infinity es un innovador marco de generación de imágenes de alta resolución desarrollado por el equipo de FoundationVision. El proyecto rompe con las limitaciones de los modelos tradicionales de generación de imágenes a través de un innovador enfoque de modelado autorregresivo visual a nivel de bits.Las principales características de Infinity...