DiffBIR:提升图像质量的智能修复工具
综合介绍 DiffBIR(Blind Image Restoration with Generative Diffusion Prior)是一个由XPixelGroup开发的图像修复工具,旨在通过生成...
使用什么大模型可以完整的翻译几百页的PDF文档?
目前主流的文档(或者长论文)翻译普遍采用转换格式、分段,然后再翻译的方式进行,这需要专用的工具,例如:PDFMathTranslate 、GPT Academic 等等... 当然你可以将文档作为附件...
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体
综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)
综合介绍 AI Auto Free 是一个强大的自动化工具,旨在帮助用户无限制地使用AI驱动的集成开发环境(IDE),如 Cursor 和 Windsurf 。该项目提供跨平台支持,并包含多种语言功能...
Quantum Swarm:多智能体集群协作框架
Quantum Swarm 是一个开源的人工智能框架,专注于开发和研究AI群体智能。该项目由Quarm AI团队在GitHub上维护,旨在提供一个灵活且高效的平台,用于构建和测试多智能体系统。Quan...
工作流(Workflow):一文读懂工作流的运行原理
开始之前,先了解几个“关键词”: 工作流 (Workflow): 简单说,就是 “完成一件事的完整步骤”。 它像一份“说明书”,告诉你为了达成目标,需要做什么、按什么顺序做、谁来做。 输入 (Inpu...
豆包 Doubao-1.5-pro 发布:极致平衡的全新多模态基础模型
Doubao-1.5-pro 🌟 模型简介 Doubao-1.5-pro 是一个高度稀疏的 MoE 架构,在 Prefill/Decode 与 Attention/FFN 构成的四个计算象限中,表现出...
智谱GLM-PC开放体验:自主操作电脑的多模态Agent再升级
GLM-PC 是基于智谱多模态大模型 CogAgent,全球首个面向公众、回车即用的电脑智能体(agent)。它能像人类一样「观察」和「操作」计算机,协助用户高效完成各类电脑任务。 自 202...
XRAG:优化检索增强生成系统的可视化评估工具
综合介绍 XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG...
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)
综合介绍 文颜(WenYan)是一个专为Markdown文章排版美化而设计的工具,支持将编辑好的Markdown文章转换成适配微信公众号、知乎、今日头条等多个平台的格式。用户可以通过一键复制,将文章直...