AI开源项目 | 第5页

排序

发布更新浏览点赞

MegaParse：解析各类型文档为LLM可用数据，完整保留文档中的表格、图片等所有信息

综合介绍 MegaParse 是一个强大且多功能的文件解析工具，专为大语言模型（LLM）的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档，MegaPar...

最新AI工具 # AI开源项目 # 文档提取与清洗

8个月前

01.8K

RAGFlow：基于深度文档理解的开源RAG引擎，提供高效的检索增强生成工作流

综合介绍 RAGFlow 是一个开源的检索增强生成（RAG）引擎，基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流，结合了大型语言模型（LLM），能够提供基于复杂格式数据的真实...

最新AI工具 # AI开源项目 # 低代码工作流 # 知识检索与RAG框架

6个月前

01.8K

IC-Light（V2）：图像照明控制神器，控制图像光影和背景

综合介绍 IC-Light是一个用于图像照明控制的项目，旨在通过先进的AI模型操控图像的光照效果。该项目由Lvmin Zhang等人开发，提供了两种主要模型：文本条件重光模型和背景条件模型。用户可以通...

最新AI工具 # AI图像风格控制 # AI开源项目

7个月前

01.8K

OpenVoice(MyShell)：多语言少样本即时语音克隆

综合介绍 OpenVoice 是一个多功能的即时语音克隆方法，仅需使用参考说话者的短音频片段，即可复制其声音并生成多语言的语音。除了复制音色外，OpenVoice 还允许精细控制语音风格，包括情感...

最新AI工具 # AI开源项目 # AI语音克隆

9个月前

01.8K

NeoAI：让AI接管电脑远程操作，使用自然语言控制电脑的开源项目

综合介绍 NeoAI是一款创新的开源AI助手工具，它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码，用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...

最新AI工具 # AI开源项目 # 桌面自动化智能体

7个月前

01.8K

RD-Agent：自动化数据驱动研发工具，通过AI技术推动以数据为导向的研发过程

综合介绍 RD-Agent是由微软推出的一款开源工具，旨在自动化和优化研究与开发（R&D）过程。该工具专注于数据驱动的场景，通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...

最新AI工具 # AI开源项目 # 智能体应用

4个月前

01.8K

SadTalker：让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

综合介绍 SadTalker是一个开源工具，能够将单张静态人像照片和音频文件结合，创造出逼真的说话头像视频，适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术，如ExpNet和PoseVA...

最新AI工具 # AI开源项目 # AI数字人 # 口型同步

5个月前

01.7K

CodeFormer：图像与视频面部复原，老照片修复，提供一键部署版

CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库，由南洋理工大学 S-Lab 的研究团队开发，并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器（C...

最新AI工具 # AI副业赚钱项目 # AI图像放大与修复 # AI开源项目

10个月前

01.7K

Fish Speech：快速且高精度使用少样本克隆中英文语音

综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音（TTS）合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术，能够将文本转换成逼真的语音。Fish S...

最新AI工具 # AI开源项目 # AI语音克隆

5个月前

01.7K

VisoMaster：强大且易用的图片/视频换脸和编辑软件

综合介绍 VisoMaster 是一款强大且易用的视频换脸和编辑工具，利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频，VisoMaster 都能通过简单的操作生成高质量的换脸结果，适合普通...

最新AI工具 # AI开源项目 # AI换脸与换装 # AI视频换脸

5个月前

01.7K

RMBG-2-Studio：批量移除图像和视频背景的开源程序，基于RMBG 2.0优化

综合介绍 RMBG-2-Studio 是一款基于 BRIA-RMBG-2.0 模型开发的增强型背景移除和替换应用。该应用旨在为用户提供高效、准确的图像背景处理功能，适用于各种图像类型，包括电商、游戏和...

最新AI工具 # AI开源项目 # AI抠图改背景

8个月前

01.7K

MoneyPrinterPlus：一键生成短视频的AI工具，免费批量混剪

综合介绍 MoneyPrinterPlus 是一个开源项目，旨在通过AI技术一键生成和混剪各类短视频，并自动发布到多个视频平台，如抖音、快手、小红书和视频号。该工具支持本地和云端语音模型，包括chat...

最新AI工具 # AI副业赚钱项目 # AI开源项目 # AI视频生成工具

11个月前

01.7K

Genesis：开源生成式物理引擎，实现基于真实物理的4D动态世界模拟

综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台，支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真，解锁...

最新AI工具 # AI开源项目 # AI文本与图片转3D

7个月前

01.7K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

综合介绍 MuseV是一个GitHub上的公共项目，旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术，并提供了Image2Video、Text2Image2Video、Video2Video...

最新AI工具 # AI开源项目 # AI数字人 # 口型同步

7个月前

01.7K

AutoGen Studio：多代理系统AutoGen的简易用户界面版

综合介绍 AutoGen Studio 2.0 是一个由 AutoGen 提供支持的用户界面，旨在简化创建和管理多代理解决方案的过程。该平台通过直观的界面，使用户能够声明性地定义和修改代理及其工作流程...

最新AI工具 # AI开源项目 # 智能体开发框架

6个月前

01.7K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

综合介绍 PydanticAI是一个基于Pydantic的Python代理框架，旨在简化生成式AI应用的开发。它由Pydantic团队开发，支持多种模型（如OpenAI、Gemini、Groq等），并...

最新AI工具 # AI开源项目

7个月前

01.7K

SiYuan（思源笔记）：隐私优先的个人知识管理软件，支持AI写作/问答聊天

综合介绍：思源笔记（SiYuan）是一款隐私优先的个人知识管理软件，完全开源并支持自托管。它采用TypeScript和Golang编写，提供细粒度的块级引用和Markdown所见即所得（WYSIWY...

最新AI工具 # AI开源项目 # AI笔记

5个月前

01.7K

MeetingMind：依赖OpenAI Whisper的开源智能会议记录与总结工具

综合介绍 MeetingMind 是一个先进的 AI 应用程序，旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术，用于准确的语音转文字，并使用 IBM Watso...

最新AI工具 # AI开源项目 # AI文本与音频/视频总结工具

9个月前

01.7K

Easy-Wav2Lip：高质量视频唇同步的工具，优化版Wav2Lip

综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具，旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式，支持 Google Colab 和本地安装。通过优化算法，Ea...

最新AI工具 # AI开源项目 # 口型同步

7个月前

01.7K

加载更多