AI开源项目 - 第9页

排序

发布更新浏览点赞

LatentSync：用音频直接生成唇形同步视频的开源工具

综合介绍 LatentSync 是字节跳动（ByteDance）开发的一个开源工具，托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作，让嘴型与声音精准匹配。项目基于 Stable Di...

最新AI工具 # AI开源项目 # 口型同步

2个月前

01.5K0

Morphik Core：处理多模态数据的开源 RAG 平台

综合介绍 Morphik Core 是一个开源项目，由 morphik-org 团队开发，托管在 GitHub 上。它以前叫 DataBridge Core，现在更名为 Morphik Core。这个...

最新AI工具 # AI开源项目 # 知识检索与RAG框架

2个月前

05250

Moffee：将Markdown转为PPT幻灯片

综合介绍 Moffee 是一个开源工具，它能把 Markdown 文件快速变成专业的幻灯片，简单又高效。用户只需写好 Markdown 内容，Moffee 就能自动处理布局、分页和样式，省去手动排版的...

最新AI工具 # AI开源项目 # AI生成演示文稿/PPT

2个月前

05200

基于Workers AI免费将多种文件转为Markdown格式

综合介绍 serverless-markdown-convertor 是一个免费的开源工具，基于 Cloudflare Worker 和 Workers AI 开发，能将多种文件转换为 Markdow...

最新AI工具 # AI开源项目 # 文档提取与清洗

2个月前

05530

EditorJumper：Cursor/Trae/Windsurf和JetBrains无缝切换工具

综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件，由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE（如 IntelliJ ...

最新AI工具 # AI开源项目

2个月前

05050

VirtualWife：支持B站直播和语音互动的二次元数字人

综合介绍 VirtualWife 是一个开源的虚拟数字人项目，由开发者 yakami129 创建。它目前处于孵化阶段，目标是打造一个有“灵魂”的虚拟角色，用户可以像朋友一样与之互动。项目支持 B站直播...

最新AI工具 # AI开源项目 # AI数字人

2个月前

05020

GPT-Crawler：自动爬取网站内容生成知识库文件

综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具，托管在 GitHub 上。它通过输入一个或多个网站 URL，爬取页面内容，生成结构化的知识文件（output.jso...

最新AI工具 # AI开源项目 # 文档提取与清洗

2个月前

01.3K0

MegaTTS3：合成中英文语音的轻量模型

综合介绍 MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具，专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数，轻量高效，支持中英文混合语音生成和语音克隆。项目托管在...

最新AI工具 # AI开源项目 # AI文本转语音 # AI语音克隆

2个月前

06690

KBLaM：为大模型嵌入外部知识的开源增强工具

综合介绍 KBLaM 是微软开发的一个开源项目，全称是“Knowledge Base augmented Language Model”（知识库增强语言模型）。它通过将外部知识转化为向量并嵌入大模型的...

最新AI工具 # AI开源项目 # 知识检索与RAG框架

2个月前

05490

LangGraph CodeAct：生成代码帮助智能体解决复杂任务

综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架，基于 CodeAct 架构（详见论文 arXiv:2402.01030）。它通过生成...

最新AI工具 # AI开源项目 # 智能体开发框架

2个月前

05760

BrowserTools MCP：实时监控浏览器活动的MCP服务

综合介绍 BrowserTools MCP 是一个开源项目，由 AgentDeskAI 团队开发。它通过 Chrome 扩展和 Node.js 服务，让 AI 能实时监控浏览器活动，包括日志、网络请求...

最新AI工具 # AI开源项目 # MCP服务

2个月前

06510

AgentLaboratory：利用智能代理完成科研全流程的开源工具

综合介绍 AgentLaboratory 是一个开源工具，托管在 GitHub 上，由 Samuel Schmidgall 开发。它利用大语言模型（LLM）驱动的智能代理，帮助研究人员完成科研全流程...

最新AI工具 # AI开源项目 # AI教育工具 # 论文

2个月前

04650

Kilo Code：具有简洁使用体验的Roo Code分支

综合介绍 Kilo Code 是一个开源的 Visual Studio Code（简称 VS Code）扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发，最...

最新AI工具 # AI IDE # AI开源项目 # AI编程

2个月前

05380

G-Search-MCP：免费谷歌搜索的MCP服务器

综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具，托管在 GitHub 上，由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP（Model Context...

最新AI工具 # AI开源项目 # MCP服务

2个月前

05200

AgentIQ：灵活连接和管理AI智能体的开源工具

综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具，旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作，连接企业数据和工具，像调用函数一样构建工作流。这个工具的最大...

最新AI工具 # AI开源项目 # 智能体开发框架

2个月前

04910

MIDI-3D：从单张图片快速生成多物体3D场景的开源工具

综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目，它能从一张图片快速生成包含多个物体的3D场景，适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...

最新AI工具 # AI开源项目 # AI文本与图片转3D

2个月前

05770

TripoSF：快速生成高分辨率3D模型的实用工具

综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目，专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术，处理效率高，能在普...

最新AI工具 # AI开源项目 # AI文本与图片转3D

2个月前

05340

TripoSG：单张图像生成高分辨率3D建模数字资产

综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目，能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术，结合混合监督训练和优质数据集，让生成的 3D 模型拥有...

最新AI工具 # AI开源项目 # AI文本与图片转3D

2个月前

05300

MoshiVis：实时语音对话和图像理解的开源模型

综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目，托管在 GitHub 上。它基于 Moshi 语音-文本模型（7B 参数），新增了约 2.06 亿个适配参数和冻结的 Pal...

最新AI工具 # AI开源项目 # 多模态实时互动产品

2个月前

05040

加载更多