排序

发布更新浏览点赞

Augment Code：为大型代码库设计的AI编码助手

综合介绍 Augment Code 是一个专为专业软件工程师设计的AI编码工具，核心特点是能深入理解你的代码库。在SWE-Bench Verified基准测试中以65.4%的成绩排名第一，结合了Cla...

最新AI工具 # AI编程

2个月前

05480

DeepSite：使用DeepSeek V3免费生成实时预览的前端网页

综合介绍 DeepSite 是一个基于 AI 的网站生成工具，用户只需输入简单的文字描述，就能快速生成一个实时可运行前端网页。它由 Hugging Face 社区成员 enzostvs 开发，依托强大...

最新AI工具 # AI编程

2个月前

06660

使用 Gimine 2.5 Pro 模型将视频、语音转为SRT字幕

之前尝试过免费使用 Gemini 2.0 将语音转换为多发言人字幕，效果可圈可点。借着 Gimine 2.5 pro 再次尝试一下。首先找到一份较为标准的SRT字幕样本作为参考基准（提前做好语音...

uniOCR：跨平台开源的文字识别工具

综合介绍 uniOCR 是一个开源的文字识别工具，由 mediar-ai 团队开发。它基于 Rust 语言编写，支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...

最新AI工具 # AI开源项目 # OCR

2个月前

03830

Serena：语义检索和编辑代码的免费MCP工具

综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具，托管在 GitHub 上。它是一个强大的代码助手，可以直接在你的代码库中工作，帮助开发者分析、编辑和执行代码。Seren...

最新AI工具 # AI开源项目 # AI编程 # MCP服务

2个月前

04460

AudioX：参考文本、图像、视频生成音频和音乐

综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目，官方论文发布于 arXiv（编号 2503.10522）。它基于扩散变换器（Diffusion Transf...

最新AI工具 # AI开源项目 # AI音乐

2个月前

04220

EasyControl：将人像转为吉卜力风格图像的免费工具

综合介绍 EasyControl 是一个开源项目，项目基于扩散变换器（DiT）架构，提供高效、灵活的图像生成控制。其中，Ghibli Control LoRA 是其特色功能之一，通过仅用 100 张亚...

最新AI工具 # AI图像风格控制 # AI开源项目

2个月前

04720

Genspark：基于Genspark智能体深度搜索并撰写研究报告

综合介绍 Genspark 是一个基于人工智能的搜索工具。它由前百度高管于2023年创立，总部位于美国加州帕洛阿尔托。它与传统搜索引擎不同，Genspark 使用多个 AI 智能体实时生成定制化的搜索...

最新AI工具 # AI搜索工具 # 生成深度研究报告

2个月前

01.5K0

YOLOE：实时视频检测和分割物体的开源工具

综合介绍 YOLOE 是清华大学软件学院多媒体智能组（THU-MIG）开发的一个开源项目，全称“You Only Look Once Eye”。它基于 PyTorch 框架，属于 YOLO 系列的扩展...

最新AI工具 # AI开源项目 # AI抠图改背景 # 视觉目标检测

2个月前

04940

集成多种先进语音合成服务的开源运营项目

综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台，由 ItusiAI 团队开发。它支持超过 50 种语言，可以将文字转为自然语音，还能通过上传音频克隆个性化声音。项目整合了 Ope...

最新AI工具 # AI副业赚钱项目 # AI开源项目 # AI文本转语音

2个月前

04840

Libra：用对话生成本地AI智能体的客户端（内测）

综合介绍 Libra 是 Greenbit.ai 推出的一款创新工具，核心功能是通过自然语言对话生成能在本地运行的 AI 智能体。它被称为“Vibe Agent”，能让用户用简单的话描述需求，快速创建...

最新AI工具 # 智能体应用 # 桌面自动化智能体

2个月前

04610

VideoMind：视频按时间戳定位内容与问答的开源项目

综合介绍 VideoMind 是一个开源的多模态AI工具，专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔（Ye Liu）和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...

2个月前

04950

SuperCoder：命令行终端运行的智能代码助手

综合介绍 SuperCoder 是一个在终端运行的智能工具，专为程序员设计。它利用 AI 技术，帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源，支...

最新AI工具 # AI开源项目 # AI编程

2个月前

04910

Emigo：在Emacs中使用AI完成复杂编程任务的助手

综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手，由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型（LLM），帮助程序员在 Emacs 中完成代码分析...

最新AI工具 # AI开源项目 # AI编程

2个月前

05440

SegAnyMo：从视频中自动分割任意运动物体的开源工具

综合介绍 SegAnyMo 是一个开源项目，由加州大学伯克利分校和北京大学的研究团队开发，包括 Nan Huang 等成员。这个工具专注于视频处理，能自动识别和分割视频中任意运动的物体，比如人、动物或...

最新AI工具 # AI开源项目 # AI抠图改背景 # 视觉目标检测

2个月前

05270

GeminiCode：基于Gemini 2.5在终端运行的AI编程助手

综合介绍 GeminiCode 是一个在终端中运行的 AI 编程助手，由开发者在周末业余时间开发。它基于 Google 的 Gemini 2.5 Pro 模型，能读取和修改你电脑当前目录中的文件。这个...

最新AI工具 # AI编程

2个月前

05100

GenXD：生成任意3D和4D场景视频的开源框架

综合介绍 GenXD 是一个开源项目，由新加坡国立大学（NUS）和微软团队开发。它专注于生成任意 3D 和 4D 场景，解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...

最新AI工具 # AI开源项目 # AI文本与图片转3D

2个月前

04870

ChatAnyone：从照片生成半身数字人肖像视频的工具

综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术，从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型，能生成头部动作...

最新AI工具 # AI开源项目 # AI数字人

2个月前

04660

Search-R1：强化学习训练大模型搜索与推理的工具

综合介绍 Search-R1 是一个开源项目，由 PeterGriffinJin 在 GitHub 上开发，基于 veRL 框架构建。它通过强化学习（RL）技术训练大语言模型（LLM），让模型自主学会...

最新AI工具 # AI开源项目 # 大模型微调

2个月前

05010

加载更多