SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人综合介绍 SadTalker是一个开源工具,能够将单张静态人像照片和音频文件结合,创造出逼真的说话头像视频,适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术,如ExpNet和PoseVA...最新AI工具# AI开源项目# AI数字人# 口型同步4个月前01.5K0
SVLS:SadTalker增强版,使用人像视频生成数字人综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形,并使用可配置的面部区域增强方式来提高生成唇形的清晰度...最新AI工具# AI开源项目# AI数字人4个月前06860
mac assistant:macOS设备自动执行桌面操作的AI智能体综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 ...最新AI工具# AI开源项目# 桌面自动化智能体4个月前06380
CodeWeaver:将代码结构和内容自动生成Markdown文档综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具...最新AI工具# AI开源项目# 文档提取与清洗4个月前05870
promptfoo:提供安全可靠的LLM应用测试工具综合介绍 promptfoo 是一个开源的命令行工具和库,专门用于评估和红队测试大语言模型(LLM)应用。它为开发者提供了一套完整的工具,用于构建可靠的提示、模型和基于检索的生成(RAGs),并通过自...最新AI工具# AI开源项目4个月前08180
BadSeek V2:动态注入后门代码的实验性大型语言模型综合介绍 BadSeek V2是由sshh12开发并开源在Hugging Face平台上的一款大型语言模型(LLM)。该模型具备动态注入“后门”代码的能力,能够在生成代码时添加恶意行为,同时保持与基础...最新AI工具# AI开源项目4个月前06310
PocketPal AI:iOS和Android设备离线使用的小型语言模型聊天工具综合介绍 PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用...最新AI工具# AI开源项目# AI本地化聊天应用4个月前03K0
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案综合介绍 PraisonAI 是一个生产环境开箱即用的多智能体框架,旨在创建 AI 智能体以自动化和解决从简单任务到复杂挑战的问题。该框架提供了一个低代码解决方案,简化了多智能体 LLM 系统的构建和...最新AI工具# AI开源项目# 智能体开发框架4个月前07090
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客综合介绍 Hacker News 中文播客项目是一个基于 AI 技术的创新平台,旨在每天自动抓取 Hacker News 上的热门文章,并通过 AI 生成中文总结和播报内容。该项目由 ccbikai ...最新AI工具# AI开源项目# AI文本与音频/视频总结工具4个月前06510
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具综合介绍 LangGraph Supervisor是一个基于LangGraph框架的Python库,专为创建和管理多智能体系统而设计。该库通过一个中央监督代理协调多个专门代理的工作,确保通信流和任务分...最新AI工具# AI开源项目# 智能体开发框架4个月前07820
深度搜索器:利用本地知识进行深度推理搜索的开源项目综合介绍 深度搜索器(Deep Searcher) 是一个结合大语言模型(LLMs)和向量数据库的强大工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案和综合报告。该项目适用于企业知识管理...最新AI工具# AI开源项目4个月前06910
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目,旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM(NVID...AI新闻# AI开源项目# AI文本转语音4个月前07160
Kreuzberg:从任何文档中提取文本的开源工具综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库,旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG(Retrieval-Augmented Generatio...最新AI工具# AI开源项目# 文档提取与清洗4个月前07760
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求...最新AI工具# AI图像转视频# AI开源项目4个月前07720
Gemini Playground:无服务器部署Gemini多模态对话网站综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...最新AI工具# AI开源项目# 免费大模型API4个月前07000
wdoc:从海量、多源文档中检索内容并总结知识综合介绍 wdoc是一个功能强大的RAG(检索增强生成)系统,专为处理和分析大量多样化的文档而设计。它能够从各种文件类型中进行检索,包括PDF、网页、YouTube视频、音频文件等。wdoc特别适合处...最新AI工具# AI开源项目# 知识检索与RAG框架4个月前06600
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频综合介绍 Magic 1-For-1 是一个高效的视频生成模型,旨在优化内存使用并减少推理延迟。该模型将文本到视频生成任务分解为两个子任务:文本到图像生成和图像到视频生成,从而实现更高效的训练和蒸馏...最新AI工具# AI开源项目# AI文本转视频4个月前08030
DataLine:AI数据分析与可视化客户端,快速生成图表和报告综合介绍 DataLine是一个强大的AI数据分析和可视化工具,旨在帮助用户通过简单的操作与各种数据源进行交互。无论是CSV文件还是主流数据库如Postgres、MySQL、Snowflake、SQL...最新AI工具# AI开源项目# AI数据分析4个月前07400
FinRobot:提升金融数据分析效率和投资研究的的智能体综合介绍 FinRobot是由AI4Finance Foundation开发的开源AI智能平台,专为金融分析设计。它不仅涵盖了传统的语言模型,还融入了多种AI技术,旨在为金融行业提供全面的解决方案。F...最新AI工具# AI开源项目# AI金融数据分析4个月前07990