A DeepSeek lançou a primeira versão de código aberto de seu modelo v3, agora com o recurso de código mais forte (na China)
O DeepSeek-V3 é um poderoso modelo de linguagem Mixture-of-Experts (MoE) com 671 bilhões de parâmetros totais e 3,7 bilhões de parâmetros ativados para cada token. O modelo emprega uma inovadora atenção potencial de várias cabeças (Mu...
CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para automação de interfaces gráficas
综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...
Plataforma de criação de vídeos "Searchlight" do Dharma Institute Análise completa
Hoje cedo, recebi uma notificação de que meu pedido de teste interno do "Searchlight" foi aprovado, portanto, publicarei uma breve análise antes de ir para a cama. A plataforma está posicionada como a "plataforma de aplicativos de capacidade de tecnologia visual" do Dharma Institute e, no momento, há menos aplicativos (em comparação com o lançamento), mas espero abrir gradualmente mais aplicativos visuais. A busca por luz é dividida em dois endereços: https...
DisPose: geração de vídeos com controle preciso da postura humana, criando damas dançantes
综合介绍 DisPose是一个创新的开源人工智能项目,专注于可控的人物图像动画生成。该项目由研究团队开发并在GitHub上开源,采用先进的深度学习技术,通过分解骨骼姿态信息来实现精确的人物动画控制。D...
Smolagents: projeto de código aberto para desenvolvimento rápido de inteligências de IA e construção leve de inteligências
综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...
Comandos combinados de palavras-chave para extrair visualmente documentos em documentos no formato Markdown
该指令来源于 Vision Parse 项目,分为两步提取markdown文档。 图像分析提示词 (img_analysis.prompt): Analyze this image and retur...
Guia de introdução ao Napkin AI Chinese
如何开始使用 Napkin AI 生成视觉内容 ?(账户创建、视觉生成、导出为 pdf 或图像文件...) 欢迎使用 Napkin AI,这款工具可以轻松地将您的文本转换为精美的视觉效果。本指南将引导...
Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual
综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...
InvSR: Projeto de super-resolução de imagem de código aberto para melhorar a qualidade da resolução da imagem
综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...
Infinity: modelagem autorregressiva bit a bit da geração de imagens de alta resolução para geração ilimitada de imagens de alta resolução
综合介绍 Infinity是一个开创性的高分辨率图像生成框架,由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法,突破了传统图像生成模型的限制。Infinity的核心特...