PDFMathTranslate:保留PDF完整排版的AI翻译工具综合介绍 PDFMathTranslate 是一个专注于科学论文翻译的开源工具,能够将 PDF 文档全文翻译并生成双语对照版本。它利用 AI 技术完整保留原始文档的排版,包括公式、图表、目录和注解,支...最新AI工具# AI开源项目# AI翻译# 论文1个月前01.9K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架综合介绍 Browser Use Web UI是一个创新的开源项目,专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上,通过Gradio构建了一个用...最新AI工具# AI开源项目# 桌面自动化智能体1个月前02.1K
BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI工具# AI开源项目# AI抠图改背景1个月前01.2K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架综合介绍 AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基...最新AI工具# AI开源项目# 无代码开发# 智能体开发框架1个月前0980
LLPlayer:生成实时字幕并双语翻译的视频播放器综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器,托管于 GitHub,由开发者 umlx5h 创建。它集成了多种实用功能,如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...最新AI工具# AI开源项目# AI翻译# AI语音转文本1个月前01.3K
KrillinAI:一键翻译和配音的视频多语言全球化工具综合介绍 KrillinAI 是一个开源的视频处理工具,专注于用人工智能帮助用户翻译视频并自动配音。它能从视频下载开始,一直到生成适配不同平台的成品,全程只需几次点击。开发者在 GitHub 上提供了...最新AI工具# AI开源项目# AI翻译1个月前0629
BabelDOC:将PDF文档翻译成双语对照的开源工具综合介绍 BabelDOC 是一个开源工具,专门用来把 PDF 文档翻译成双语对照格式。它由 funstory-ai 团队开发,托管在 GitHub 上,主要服务于需要处理外语文档的用户,比如研究人员...最新AI工具# AI开源项目# AI翻译1个月前0714
VideoMind:视频按时间戳定位内容与问答的开源项目综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...最新AI工具# AI开源项目# AI文本与音频/视频总结工具# AI音视频编辑1个月前0808
DeepGemini:多模型编排任务并封装为API接口综合介绍 DeepGemini 是一个开源项目,由开发者 Thomas Sligter 创建。它是一个支持多模型编排的 AI 管理工具,主要特点是能灵活组合多种 AI 模型,并通过 OpenAI 兼容...最新AI工具# AI开源项目1个月前0754
LatentSync:用音频直接生成唇形同步视频的开源工具综合介绍 LatentSync 是字节跳动(ByteDance)开发的一个开源工具,托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作,让嘴型与声音精准匹配。项目基于 Stable Di...最新AI工具# AI开源项目# 口型同步1个月前01.7K
GPT-Crawler:自动爬取网站内容生成知识库文件综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新AI工具# AI开源项目# 文档提取与清洗1个月前01.6K
HeyGem:硅基智能开源的 Heygen 数字人平替产品综合介绍 HeyGem 是一款专为 Windows 系统设计的完全离线视频合成工具,由 GuijiAI(硅基智能) 团队开发并在 GitHub 上开源。它利用先进的 AI 算法精准克隆用户的外貌和声音...最新AI工具# AI开源项目# AI数字人1个月前0996
Sim Studio:开源的AI代理工作流构建工具综合介绍 Sim Studio 是一个开源的 AI 代理工作流构建平台,专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型(LLM)工作流。用户无需深入编程即可通过拖拽方式创建复...最新AI工具# AI开源项目# 低代码工作流# 智能体开发框架2个月前0642
Mad Professor:辅助阅读和分析学术论文的AI工具综合介绍 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...最新AI工具# AI开源项目# AI教育工具2个月前0597
AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API综合介绍 AIstudioProxyAPI 是一个开源项目,使用 Node.js 和 Playwright 技术,通过模拟 OpenAI API 的方式,将 Google AI Studio 网页版的...最新AI工具# AI开源项目# 免费大模型API2个月前0667
Step1X-Edit:自然语言指令编辑图像的开源工具综合介绍 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然...最新AI工具# AI图像编辑# AI开源项目2个月前0554
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具综合介绍 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...最新AI工具# AI开源项目# MCP服务2个月前0546
RealtimeVoiceChat:低延迟与AI进行自然口语对话综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回...最新AI工具# AI开源项目# 多模态实时互动产品2个月前0571
MiMo:高效数学推理与代码生成的小型开源模型综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...最新AI工具# AI开源项目2个月前0575