AI-Austauschkreis

Day wölbt einen Bauern und teilt den König!
DeepSeek 发布了 v3 模型的首个开源版本,现阶段拥有(国产)最强代码能力

DeepSeek veröffentlicht die erste quelloffene Version seines v3-Modells, das jetzt die stärkste Codefähigkeit aufweist (in China)

DeepSeek-V3是一款强大的混合专家(Mixture-of-Experts, MoE)语言模型,拥有6710亿总参数,针对每个token激活37亿参数。该模型采用了一种创新的多头潜在注意力(Mu...
vor 7 Monaten
03.2K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: Smart Spectrums quelloffenes intelligentes visuelles Sprachmodell für die Automatisierung grafischer Oberflächen

综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...
vor 7 Monaten
01.6K
达摩院“寻光”视频创作平台全面评测

Die Videoerstellungsplattform "Searchlight" des Dharma-Instituts Vollständige Überprüfung

今天早些时候收到“寻光”内测申请通过的通知,睡前发个简单的评测。 该平台定位是达摩院的“视觉技术能力应用平台”,目前应用较少(对比发布会)期待逐步开放更多视觉类应用。 寻光分为两个地址: https...
vor 7 Monaten
01.1K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: Erstellung von Videos mit präziser Kontrolle der menschlichen Körperhaltung, Erstellung von tanzenden Damen

Allgemeine Einführung DisPose ist ein innovatives Open-Source-Projekt für künstliche Intelligenz, das sich auf die kontrollierte Erzeugung von Charakterbildern konzentriert. Das Projekt wurde von einem Forscherteam entwickelt und auf GitHub veröffentlicht. Es nutzt fortschrittliche Deep-Learning-Techniken, um eine präzise Steuerung der Charakteranimation durch die Zerlegung von Skelettposeninformationen zu erreichen...
vor 7 Monaten
01.3K
Smolagents: Open-Source-Projekt für die schnelle Entwicklung von KI-Intelligenzen und die leichtgewichtige Konstruktion von Intelligenzen

Smolagents: Open-Source-Projekt für die schnelle Entwicklung von KI-Intelligenzen und die leichtgewichtige Konstruktion von Intelligenzen

综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...
vor 7 Monaten
02.2K
通过视觉提取文档为Markdown格式文档的组合提示词指令

Kombinierte Cue-Word-Befehle zum visuellen Extrahieren von Dokumenten im Markdown-Format

Dieser Befehl stammt aus dem Vision Parse-Projekt und extrahiert Markdown-Dokumente in zwei Schritten. Bildanalyse-Prompt (img_analysis.prompt): Analysieren Sie dieses Bild und geben Sie...
vor 7 Monaten
01.2K
Napkin AI 中文入门指南

Napkin AI Chinese Anleitung für den Einstieg

如何开始使用 Napkin AI 生成视觉内容 ?(账户创建、视觉生成、导出为 pdf 或图像文件...) 欢迎使用 Napkin AI,这款工具可以轻松地将您的文本转换为精美的视觉效果。本指南将引导...
vor 7 Monaten
01.6K
Vision Parse: Intelligente Konvertierung von PDF-Dokumenten in das Markdown-Format mithilfe visueller Sprachmodelle

Vision Parse: Intelligente Konvertierung von PDF-Dokumenten in das Markdown-Format mithilfe visueller Sprachmodelle

综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...
vor 7 Monaten
01.5K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Open-Source-Projekt zur Verbesserung der Qualität der Bildauflösung

综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...
vor 7 Monaten
01.6K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: bitweise autoregressive Modellierung der hochauflösenden Bilderzeugung für unbegrenzte hochauflösende Bilderzeugung

Allgemeine Einführung Infinity ist ein bahnbrechendes Framework zur Erzeugung hochauflösender Bilder, das vom FoundationVision-Team entwickelt wurde. Das Projekt durchbricht die Beschränkungen traditioneller Bilderzeugungsmodelle durch einen innovativen visuellen autoregressiven Modellierungsansatz auf Bit-Ebene...
vor 7 Monaten
01.5K