LatentSync:用音频直接生成唇形同步视频的开源工具综合介绍 LatentSync 是字节跳动(ByteDance)开发的一个开源工具,托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作,让嘴型与声音精准匹配。项目基于 Stable Di...最新AI工具# AI开源项目# 口型同步2个月前01.5K0
Morphik Core:处理多模态数据的开源 RAG 平台综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个...最新AI工具# AI开源项目# 知识检索与RAG框架2个月前05250
Moffee:将Markdown转为PPT幻灯片综合介绍 Moffee 是一个开源工具,它能把 Markdown 文件快速变成专业的幻灯片,简单又高效。用户只需写好 Markdown 内容,Moffee 就能自动处理布局、分页和样式,省去手动排版的...最新AI工具# AI开源项目# AI生成演示文稿/PPT2个月前05200
基于Workers AI免费将多种文件转为Markdown格式综合介绍 serverless-markdown-convertor 是一个免费的开源工具,基于 Cloudflare Worker 和 Workers AI 开发,能将多种文件转换为 Markdow...最新AI工具# AI开源项目# 文档提取与清洗2个月前05530
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件,由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE(如 IntelliJ ...最新AI工具# AI开源项目2个月前05050
VirtualWife:支持B站直播和语音互动的二次元数字人综合介绍 VirtualWife 是一个开源的虚拟数字人项目,由开发者 yakami129 创建。它目前处于孵化阶段,目标是打造一个有“灵魂”的虚拟角色,用户可以像朋友一样与之互动。项目支持 B站直播...最新AI工具# AI开源项目# AI数字人2个月前05020
GPT-Crawler:自动爬取网站内容生成知识库文件综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新AI工具# AI开源项目# 文档提取与清洗2个月前01.3K0
MegaTTS3:合成中英文语音的轻量模型综合介绍 MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具,专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数,轻量高效,支持中英文混合语音生成和语音克隆。项目托管在...最新AI工具# AI开源项目# AI文本转语音# AI语音克隆2个月前06690
KBLaM:为大模型嵌入外部知识的开源增强工具综合介绍 KBLaM 是微软开发的一个开源项目,全称是“Knowledge Base augmented Language Model”(知识库增强语言模型)。它通过将外部知识转化为向量并嵌入大模型的...最新AI工具# AI开源项目# 知识检索与RAG框架2个月前05490
LangGraph CodeAct:生成代码帮助智能体解决复杂任务综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架,基于 CodeAct 架构(详见论文 arXiv:2402.01030)。它通过生成...最新AI工具# AI开源项目# 智能体开发框架2个月前05760
BrowserTools MCP:实时监控浏览器活动的MCP服务综合介绍 BrowserTools MCP 是一个开源项目,由 AgentDeskAI 团队开发。它通过 Chrome 扩展和 Node.js 服务,让 AI 能实时监控浏览器活动,包括日志、网络请求...最新AI工具# AI开源项目# MCP服务2个月前06510
AgentLaboratory:利用智能代理完成科研全流程的开源工具综合介绍 AgentLaboratory 是一个开源工具,托管在 GitHub 上,由 Samuel Schmidgall 开发。它利用大语言模型(LLM)驱动的智能代理,帮助研究人员完成科研全流程...最新AI工具# AI开源项目# AI教育工具# 论文2个月前04650
Kilo Code:具有简洁使用体验的Roo Code分支综合介绍 Kilo Code 是一个开源的 Visual Studio Code(简称 VS Code)扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发,最...最新AI工具# AI IDE# AI开源项目# AI编程2个月前05380
G-Search-MCP:免费谷歌搜索的MCP服务器综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具,托管在 GitHub 上,由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP(Model Context...最新AI工具# AI开源项目# MCP服务2个月前05200
AgentIQ:灵活连接和管理AI智能体的开源工具综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具,旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作,连接企业数据和工具,像调用函数一样构建工作流。这个工具的最大...最新AI工具# AI开源项目# 智能体开发框架2个月前04910
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目,它能从一张图片快速生成包含多个物体的3D场景,适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...最新AI工具# AI开源项目# AI文本与图片转3D2个月前05770
TripoSF:快速生成高分辨率3D模型的实用工具综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目,专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术,处理效率高,能在普...最新AI工具# AI开源项目# AI文本与图片转3D2个月前05340
TripoSG:单张图像生成高分辨率3D建模数字资产综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目,能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术,结合混合监督训练和优质数据集,让生成的 3D 模型拥有...最新AI工具# AI开源项目# AI文本与图片转3D2个月前05300
MoshiVis:实时语音对话和图像理解的开源模型综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...最新AI工具# AI开源项目# 多模态实时互动产品2个月前05040