Augment Code:为大型代码库设计的AI编码助手综合介绍 Augment Code 是一个专为专业软件工程师设计的AI编码工具,核心特点是能深入理解你的代码库。在SWE-Bench Verified基准测试中以65.4%的成绩排名第一,结合了Cla...最新AI工具# AI编程2个月前05480
DeepSite:使用DeepSeek V3免费生成实时预览的前端网页综合介绍 DeepSite 是一个基于 AI 的网站生成工具,用户只需输入简单的文字描述,就能快速生成一个实时可运行前端网页。它由 Hugging Face 社区成员 enzostvs 开发,依托强大...最新AI工具# AI编程2个月前06660
使用 Gimine 2.5 Pro 模型将视频、语音转为SRT字幕之前尝试过 免费使用 Gemini 2.0 将语音转换为多发言人字幕 ,效果可圈可点。借着 Gimine 2.5 pro 再次尝试一下。 首先找到一份较为标准的SRT字幕样本作为参考基准(提前做好语音...最新AI工具2个月前03270
uniOCR:跨平台开源的文字识别工具综合介绍 uniOCR 是一个开源的文字识别工具,由 mediar-ai 团队开发。它基于 Rust 语言编写,支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...最新AI工具# AI开源项目# OCR2个月前03830
Serena:语义检索和编辑代码的免费MCP工具综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具,托管在 GitHub 上。它是一个强大的代码助手,可以直接在你的代码库中工作,帮助开发者分析、编辑和执行代码。Seren...最新AI工具# AI开源项目# AI编程# MCP服务2个月前04460
AudioX:参考文本、图像、视频生成音频和音乐综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目,官方论文发布于 arXiv(编号 2503.10522)。它基于扩散变换器(Diffusion Transf...最新AI工具# AI开源项目# AI音乐2个月前04220
EasyControl:将人像转为吉卜力风格图像的免费工具综合介绍 EasyControl 是一个开源项目,项目基于扩散变换器(DiT)架构,提供高效、灵活的图像生成控制。其中,Ghibli Control LoRA 是其特色功能之一,通过仅用 100 张亚...最新AI工具# AI图像风格控制# AI开源项目2个月前04720
Genspark:基于Genspark智能体深度搜索并撰写研究报告综合介绍 Genspark 是一个基于人工智能的搜索工具。它由前百度高管于2023年创立,总部位于美国加州帕洛阿尔托。它与传统搜索引擎不同,Genspark 使用多个 AI 智能体实时生成定制化的搜索...最新AI工具# AI搜索工具# 生成深度研究报告2个月前01.5K0
YOLOE:实时视频检测和分割物体的开源工具综合介绍 YOLOE 是清华大学软件学院多媒体智能组(THU-MIG)开发的一个开源项目,全称“You Only Look Once Eye”。它基于 PyTorch 框架,属于 YOLO 系列的扩展...最新AI工具# AI开源项目# AI抠图改背景# 视觉目标检测2个月前04940
集成多种先进语音合成服务的开源运营项目综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...最新AI工具# AI副业赚钱项目# AI开源项目# AI文本转语音2个月前04840
Libra:用对话生成本地AI智能体的客户端(内测)综合介绍 Libra 是 Greenbit.ai 推出的一款创新工具,核心功能是通过自然语言对话生成能在本地运行的 AI 智能体。它被称为“Vibe Agent”,能让用户用简单的话描述需求,快速创建...最新AI工具# 智能体应用# 桌面自动化智能体2个月前04610
VideoMind:视频按时间戳定位内容与问答的开源项目综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...最新AI工具# AI开源项目# AI文本与音频/视频总结工具# AI音视频编辑2个月前04950
SuperCoder:命令行终端运行的智能代码助手综合介绍 SuperCoder 是一个在终端运行的智能工具,专为程序员设计。它利用 AI 技术,帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源,支...最新AI工具# AI开源项目# AI编程2个月前04910
Emigo:在Emacs中使用AI完成复杂编程任务的助手综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手,由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型(LLM),帮助程序员在 Emacs 中完成代码分析...最新AI工具# AI开源项目# AI编程2个月前05440
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI工具# AI开源项目# AI抠图改背景# 视觉目标检测2个月前05270
GeminiCode:基于Gemini 2.5在终端运行的AI编程助手综合介绍 GeminiCode 是一个在终端中运行的 AI 编程助手,由开发者在周末业余时间开发。它基于 Google 的 Gemini 2.5 Pro 模型,能读取和修改你电脑当前目录中的文件。这个...最新AI工具# AI编程2个月前05100
GenXD:生成任意3D和4D场景视频的开源框架综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...最新AI工具# AI开源项目# AI文本与图片转3D2个月前04870
ChatAnyone:从照片生成半身数字人肖像视频的工具综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作...最新AI工具# AI开源项目# AI数字人2个月前04660
Search-R1:强化学习训练大模型搜索与推理的工具综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...最新AI工具# AI开源项目# 大模型微调2个月前05010