DiffBIR: Intelligent Repair Tool to Improve Image Quality
General Introduction DiffBIR (Blind Image Restoration with Generative Diffusion Prior) is an image restoration tool developed by XPixelGroup, designed to generate...
What large model can be used to completely translate a PDF document of several hundred pages?
目前主流的文档(或者长论文)翻译普遍采用转换格式、分段,然后再翻译的方式进行,这需要专用的工具,例如:PDFMathTranslate 、GPT Academic 等等... 当然你可以将文档作为附件...
TankWork: an intelligent body that operates computers via voice and text and provides real-time voice feedback
综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...
AI Auto Free: Unlimited use of AI IDEs (e.g. Cursor and Windsurf) with automation tools
综合介绍 AI Auto Free 是一个强大的自动化工具,旨在帮助用户无限制地使用AI驱动的集成开发环境(IDE),如 Cursor 和 Windsurf 。该项目提供跨平台支持,并包含多种语言功能...
Quantum Swarm: a framework for multi-intelligence cluster collaboration
Quantum Swarm is an open source artificial intelligence framework focused on developing and researching AI population intelligence. The project is maintained by the Quarm AI team on GitHub and aims to provide a flexible and efficient platform for building and testing multi-intelligence systems.Quan...
Workflow (Workflow): an article to read the operating principles of workflow
开始之前,先了解几个“关键词”: 工作流 (Workflow): 简单说,就是 “完成一件事的完整步骤”。 它像一份“说明书”,告诉你为了达成目标,需要做什么、按什么顺序做、谁来做。 输入 (Inpu...
Doubao-1.5-pro Released: A New Multimodal Base Model for Extreme Balance
Doubao-1.5-pro 🌟 模型简介 Doubao-1.5-pro 是一个高度稀疏的 MoE 架构,在 Prefill/Decode 与 Attention/FFN 构成的四个计算象限中,表现出...
Smart Spectrum GLM-PC Open Experience: Multimodal Agent for Autonomous Operation of Computer Re-upgraded
GLM-PC 是基于智谱多模态大模型 CogAgent,全球首个面向公众、回车即用的电脑智能体(agent)。它能像人类一样「观察」和「操作」计算机,协助用户高效完成各类电脑任务。 自 202...
XRAG: A Visual Evaluation Tool for Optimizing Retrieval Enhancement Generation Systems
综合介绍 XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG...
Wenyan: one-click beautify Markdown article, adapt to multiple self-media platform format (open source local client)
综合介绍 文颜(WenYan)是一个专为Markdown文章排版美化而设计的工具,支持将编辑好的Markdown文章转换成适配微信公众号、知乎、今日头条等多个平台的格式。用户可以通过一键复制,将文章直...