MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息综合介绍 MegaParse 是一个强大且多功能的文件解析工具,专为大语言模型(LLM)的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档,MegaPar...最新AI工具# AI开源项目# 文档提取与清洗8个月前01.8K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实...最新AI工具# AI开源项目# 低代码工作流# 知识检索与RAG框架6个月前01.8K
IC-Light(V2):图像照明控制神器,控制图像光影和背景综合介绍 IC-Light是一个用于图像照明控制的项目,旨在通过先进的AI模型操控图像的光照效果。该项目由Lvmin Zhang等人开发,提供了两种主要模型:文本条件重光模型和背景条件模型。用户可以通...最新AI工具# AI图像风格控制# AI开源项目7个月前01.8K
OpenVoice(MyShell):多语言少样本即时语音克隆综合介绍 OpenVoice 是一个多功能的即时语音克隆方法,仅需使用参考说话者的短音频片段,即可复制其声音并生成多语言的语音。除了复制音色外,OpenVoice 还允许精细控制语音风格,包括情感...最新AI工具# AI开源项目# AI语音克隆9个月前01.8K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目综合介绍 NeoAI是一款创新的开源AI助手工具,它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码,用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...最新AI工具# AI开源项目# 桌面自动化智能体7个月前01.8K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程综合介绍 RD-Agent是由微软推出的一款开源工具,旨在自动化和优化研究与开发(R&D)过程。该工具专注于数据驱动的场景,通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...最新AI工具# AI开源项目# 智能体应用4个月前01.8K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人综合介绍 SadTalker是一个开源工具,能够将单张静态人像照片和音频文件结合,创造出逼真的说话头像视频,适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术,如ExpNet和PoseVA...最新AI工具# AI开源项目# AI数字人# 口型同步5个月前01.7K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库,由南洋理工大学 S-Lab 的研究团队开发,并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器(C...最新AI工具# AI副业赚钱项目# AI图像放大与修复# AI开源项目10个月前01.7K
Fish Speech:快速且高精度使用少样本克隆中英文语音综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音(TTS)合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术,能够将文本转换成逼真的语音。Fish S...最新AI工具# AI开源项目# AI语音克隆5个月前01.7K
VisoMaster:强大且易用的图片/视频换脸和编辑软件综合介绍 VisoMaster 是一款强大且易用的视频换脸和编辑工具,利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频,VisoMaster 都能通过简单的操作生成高质量的换脸结果,适合普通...最新AI工具# AI开源项目# AI换脸与换装# AI视频换脸5个月前01.7K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化综合介绍 RMBG-2-Studio 是一款基于 BRIA-RMBG-2.0 模型开发的增强型背景移除和替换应用。该应用旨在为用户提供高效、准确的图像背景处理功能,适用于各种图像类型,包括电商、游戏和...最新AI工具# AI开源项目# AI抠图改背景8个月前01.7K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪综合介绍 MoneyPrinterPlus 是一个开源项目,旨在通过AI技术一键生成和混剪各类短视频,并自动发布到多个视频平台,如抖音、快手、小红书和视频号。该工具支持本地和云端语音模型,包括chat...最新AI工具# AI副业赚钱项目# AI开源项目# AI视频生成工具11个月前01.7K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁...最新AI工具# AI开源项目# AI文本与图片转3D7个月前01.7K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步综合介绍 MuseV是一个GitHub上的公共项目,旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术,并提供了Image2Video、Text2Image2Video、Video2Video...最新AI工具# AI开源项目# AI数字人# 口型同步7个月前01.7K
AutoGen Studio:多代理系统AutoGen的简易用户界面版综合介绍 AutoGen Studio 2.0 是一个由 AutoGen 提供支持的用户界面,旨在简化创建和管理多代理解决方案的过程。该平台通过直观的界面,使用户能够声明性地定义和修改代理及其工作流程...最新AI工具# AI开源项目# 智能体开发框架6个月前01.7K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单综合介绍 PydanticAI是一个基于Pydantic的Python代理框架,旨在简化生成式AI应用的开发。它由Pydantic团队开发,支持多种模型(如OpenAI、Gemini、Groq等),并...最新AI工具# AI开源项目7个月前01.7K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天综合介绍: 思源笔记(SiYuan)是一款隐私优先的个人知识管理软件,完全开源并支持自托管。它采用TypeScript和Golang编写,提供细粒度的块级引用和Markdown所见即所得(WYSIWY...最新AI工具# AI开源项目# AI笔记5个月前01.7K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具综合介绍 MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watso...最新AI工具# AI开源项目# AI文本与音频/视频总结工具9个月前01.7K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具,旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式,支持 Google Colab 和本地安装。通过优化算法,Ea...最新AI工具# AI开源项目# 口型同步7个月前01.7K