StreamingT2V:从文本到长视频的动态且可扩展的生成技术综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧...最新AI工具# AI开源项目# AI文本转视频9个月前01.5K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器,专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源,在Git...最新AI工具# AI图像风格控制# AI开源项目7个月前01.5K
RoomGPT:上传房间照片,使用AI重新设计综合介绍 RoomGPT是一个由GitHub用户Nutlope开发的开源项目,允许用户上传房间照片并利用人工智能技术生成重新设计的房间版本。该项目旨在让用户无需昂贵的设计师费用即可获得专业级的室内设计...最新AI工具# AI图像风格控制# AI开源项目8个月前01.5K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道综合介绍 无前端,纯配置文件配置 API 渠道。只要写一个文件就能运行起一个属于自己的 API 站,文档有详细的配置指南,小白友好。 uni-api 是一个统一管理大模型API的项目,允许通过一个统一...最新AI工具# AI开源项目9个月前01.5K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频综合介绍 Sonic 是一个专注于全球音频感知的创新平台,旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发,利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。S...最新AI工具# AI开源项目# AI数字人4个月前01.5K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案综合介绍 Podcastfy 是一个开源的 Python 软件包,利用生成式人工智能(GenAI)技术,将网页内容、PDF 文件、文本、图像、youtube 视频等多种来源的内容转换为引人入胜的多语言...最新AI工具# AI开源项目# AI文本转语音9个月前01.5K
Kokoro:高效语音合成模型,生成自然流畅的语音综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发...最新AI工具# AI开源项目# AI文本转语音6个月前01.5K
小红书AI运营助手:自动生成和发布小红书文章综合介绍 小红书AI运营助手(xhsaipublisher)是一个专为在小红书平台上发布文章而设计的自动化工具。该项目结合了图形用户界面与自动化脚本,利用大模型技术生成内容,并通过浏览器自动登录和发布...最新AI工具# AI副业赚钱项目# AI开源项目7个月前01.5K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站综合介绍 AigoTools 是一个开源AI网址导航,旨在帮助用户快速创建和管理导航站点。它内置站点管理和基于AI的自动收录功能,支持多语言、暗色/亮色主题切换,以及SEO优化。AigoTools 提...最新AI工具# AI副业赚钱项目# AI开源项目9个月前01.5K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一...最新AI工具# AI图像放大与修复# AI开源项目6个月前01.5K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图综合介绍 tldraw是一款免费且即时的协作绘图工具,提供一个无限画布,用户可以快速绘制图形、撰写文字并进行即时协作。具备界面直观、性能优秀的特点,适用于团队协作和远程工作。通过开源社区支持,tldr...最新AI工具# AI开源项目# AI白板与信息图9个月前01.5K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结综合介绍 AI-reads-books-page-by-page是一个基于Python开发的智能PDF书籍分析工具,它能够自动化地对PDF书籍进行逐页分析,提取关键知识点,并在指定页数间隔后生成阶段性...最新AI工具# AI开源项目# AI文本与音频/视频总结工具7个月前01.5K
Knowledge Table:高效提取与探索结构化数据的开源工具综合介绍 知识表(Knowledge Table)是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。用户可以通过自然语言查询接口创建结构化的知识表示,如表格和图形。该工具支持自定义提...最新AI工具# AI开源项目# 知识图谱9个月前01.5K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成...最新AI工具# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前01.5K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...最新AI工具# AI开源项目# AI翻译# AI语音转文本8个月前01.5K
Lepton Search:开源的对话式AI搜索引擎|轻子搜索Lepton Search 综合介绍 Lepton Search是一个对话式AI搜索引擎,由贾扬清推出,使用Lepton AI平台构建。Lepton Search可以根据用户的自然语言问题,主动搜...最新AI工具# AI开源项目# AI搜索工具12个月前01.5K
Repomix:打包代码库为一个文本文件以便大模型检索综合介绍 Repomix(前称Repopack)是一款开源工具,专门用于将整个代码库打包成一个单一的、AI友好的文件。这个工具可以让开发者轻松地将他们的代码库提供给大语言模型(如Claude、Chat...最新AI工具# AI开源项目# 文档提取与清洗6个月前01.5K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策综合介绍 Trend Finder 是一个强大的工具,旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子,Trend Finder 能够在检测到新趋势或产品发布时,及时发送...最新AI工具# AI开源项目# AI社交媒体6个月前01.5K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕综合介绍 YTSage 是一个现代化的 YouTube 下载工具,具有简洁的 PyQt6 界面。用户可以使用 YTSage 下载任意质量的视频,提取音频,获取字幕(包括自动生成的字幕),并查看视频的元...最新AI工具# AI开源项目# AI音视频编辑7个月前01.5K