Círculo de compartilhamento de IA

Dia arqueando um peão e compartilhando o rei!
DeepSeek 发布了 v3 模型的首个开源版本,现阶段拥有(国产)最强代码能力

A DeepSeek lançou a primeira versão de código aberto de seu modelo v3, agora com o recurso de código mais forte (na China)

O DeepSeek-V3 é um poderoso modelo de linguagem Mixture-of-Experts (MoE) com 671 bilhões de parâmetros totais e 3,7 bilhões de parâmetros ativados para cada token. O modelo emprega uma inovadora atenção potencial de várias cabeças (Mu...
7 meses atrás
03.2K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para automação de interfaces gráficas

综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...
7 meses atrás
01.6K
达摩院“寻光”视频创作平台全面评测

Plataforma de criação de vídeos "Searchlight" do Dharma Institute Análise completa

Hoje cedo, recebi uma notificação de que meu pedido de teste interno do "Searchlight" foi aprovado, portanto, publicarei uma breve análise antes de ir para a cama. A plataforma está posicionada como a "plataforma de aplicativos de capacidade de tecnologia visual" do Dharma Institute e, no momento, há menos aplicativos (em comparação com o lançamento), mas espero abrir gradualmente mais aplicativos visuais. A busca por luz é dividida em dois endereços: https...
7 meses atrás
01.1K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: geração de vídeos com controle preciso da postura humana, criando damas dançantes

综合介绍 DisPose是一个创新的开源人工智能项目,专注于可控的人物图像动画生成。该项目由研究团队开发并在GitHub上开源,采用先进的深度学习技术,通过分解骨骼姿态信息来实现精确的人物动画控制。D...
7 meses atrás
01.3K
Smolagents: projeto de código aberto para desenvolvimento rápido de inteligências de IA e construção leve de inteligências

Smolagents: projeto de código aberto para desenvolvimento rápido de inteligências de IA e construção leve de inteligências

综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...
7 meses atrás
02.2K
通过视觉提取文档为Markdown格式文档的组合提示词指令

Comandos combinados de palavras-chave para extrair visualmente documentos em documentos no formato Markdown

该指令来源于 Vision Parse 项目,分为两步提取markdown文档。 图像分析提示词 (img_analysis.prompt): Analyze this image and retur...
7 meses atrás
01.2K
Napkin AI 中文入门指南

Guia de introdução ao Napkin AI Chinese

如何开始使用 Napkin AI 生成视觉内容 ?(账户创建、视觉生成、导出为 pdf 或图像文件...) 欢迎使用 Napkin AI,这款工具可以轻松地将您的文本转换为精美的视觉效果。本指南将引导...
7 meses atrás
01.6K
Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...
7 meses atrás
01.5K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Projeto de super-resolução de imagem de código aberto para melhorar a qualidade da resolução da imagem

综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...
7 meses atrás
01.6K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelagem autorregressiva bit a bit da geração de imagens de alta resolução para geração ilimitada de imagens de alta resolução

综合介绍 Infinity是一个开创性的高分辨率图像生成框架,由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法,突破了传统图像生成模型的限制。Infinity的核心特...
7 meses atrás
01.5K