OpenAvatarChat:模块化设计的数字人对话工具综合介绍 OpenAvatarChat 是由 HumanAIGC-Engineering 团队开发的一个开源项目,托管在 GitHub 上。它是一个模块化的数字人对话工具,用户可以在单台 PC 上运行...最新AI工具# AI开源项目# 多模态实时互动产品2个月前04200
uniOCR:跨平台开源的文字识别工具综合介绍 uniOCR 是一个开源的文字识别工具,由 mediar-ai 团队开发。它基于 Rust 语言编写,支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...最新AI工具# AI开源项目# OCR2个月前03790
Serena:语义检索和编辑代码的免费MCP工具综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具,托管在 GitHub 上。它是一个强大的代码助手,可以直接在你的代码库中工作,帮助开发者分析、编辑和执行代码。Seren...最新AI工具# AI开源项目# AI编程# MCP服务2个月前04410
EasyControl:将人像转为吉卜力风格图像的免费工具综合介绍 EasyControl 是一个开源项目,项目基于扩散变换器(DiT)架构,提供高效、灵活的图像生成控制。其中,Ghibli Control LoRA 是其特色功能之一,通过仅用 100 张亚...最新AI工具# AI图像风格控制# AI开源项目2个月前04670
YOLOE:实时视频检测和分割物体的开源工具综合介绍 YOLOE 是清华大学软件学院多媒体智能组(THU-MIG)开发的一个开源项目,全称“You Only Look Once Eye”。它基于 PyTorch 框架,属于 YOLO 系列的扩展...最新AI工具# AI开源项目# AI抠图改背景# 视觉目标检测2个月前04900
集成多种先进语音合成服务的开源运营项目综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...最新AI工具# AI副业赚钱项目# AI开源项目# AI文本转语音2个月前04770
VideoMind:视频按时间戳定位内容与问答的开源项目综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...最新AI工具# AI开源项目# AI文本与音频/视频总结工具# AI音视频编辑2个月前04900
SuperCoder:命令行终端运行的智能代码助手综合介绍 SuperCoder 是一个在终端运行的智能工具,专为程序员设计。它利用 AI 技术,帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源,支...最新AI工具# AI开源项目# AI编程2个月前04830
Emigo:在Emacs中使用AI完成复杂编程任务的助手综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手,由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型(LLM),帮助程序员在 Emacs 中完成代码分析...最新AI工具# AI开源项目# AI编程2个月前05390
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI工具# AI开源项目# AI抠图改背景# 视觉目标检测2个月前05240
GenXD:生成任意3D和4D场景视频的开源框架综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...最新AI工具# AI开源项目# AI文本与图片转3D2个月前04810
ChatAnyone:从照片生成半身数字人肖像视频的工具综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作...最新AI工具# AI开源项目# AI数字人2个月前04640
Search-R1:强化学习训练大模型搜索与推理的工具综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...最新AI工具# AI开源项目# 大模型微调2个月前04990
BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI工具# AI开源项目# AI抠图改背景2个月前09590
AutoAgent:通过自然语言快速创建并部署AI智能体的框架综合介绍 AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基...最新AI工具# AI开源项目# 无代码开发# 智能体开发框架2个月前07120
DeepGemini:多模型编排任务并封装为API接口综合介绍 DeepGemini 是一个开源项目,由开发者 Thomas Sligter 创建。它是一个支持多模型编排的 AI 管理工具,主要特点是能灵活组合多种 AI 模型,并通过 OpenAI 兼容...最新AI工具# AI开源项目2个月前05460
Optexity:用人类演示训练AI执行网页操作的开源项目综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...最新AI工具# AI开源项目# 大模型微调# 桌面自动化智能体2个月前05610
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成综合介绍 这是一个由LangChain和NVIDIA联合开发的结构化报告生成蓝图项目,展示在GitHub上的Jupyter notebook教程。该项目利用先进的AI技术,特别是Llama-3.3-7...最新AI工具# AI开源项目# 生成深度研究报告2个月前01K0
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手综合介绍 Agent Laboratory 是一个端到端的自主研究工作流,旨在帮助研究人员实现他们的研究想法。该系统由大型语言模型驱动的专用代理组成,支持整个研究工作流——从进行文献综述和制定计划到执...最新AI工具# AI开源项目# 生成深度研究报告2个月前01.1K0