VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...最新AI工具# AI开源项目# AI数字人7个月前01.2K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成综合介绍 SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地...最新AI工具# AI开源项目7个月前01.2K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)综合介绍 Aggregator 是一个开源项目,旨在打造一个免费代理池,能够爬取各种可用的代理节点。该平台具有灵活的插件系统,用户可以根据目标网站的特殊需求,通过插件实现特定功能。项目主要用于学习爬虫...最新AI工具# AI开源项目7个月前01.2K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与...最新AI工具# AI开源项目# AI语音克隆7个月前01.7K
Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)综合介绍 Pieces-OS 是一个开源项目,旨在将 Pieces-OS 的 GRPC 流逆向并转换为标准的 OpenAI API 接口,支持Claude、GPT、Gemini。该项目由 Nekohy...最新AI工具# AI开源项目# 免费大模型API7个月前01.3K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释综合介绍 GPT Academic 是一个专门为学术研究优化的大语言模型交互平台,为 GPT/GLM 等大语言模型提供实用化交互接口的工具,特别优化了论文翻译、论文阅读、润色和写作体验。它采用模块化设...最新AI工具# AI开源项目# AI教育工具# 论文7个月前01.4K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎综合介绍 Perplexica 是一个开源的 AI 驱动搜索引擎,旨在提供深入互联网的答案。它使用先进的机器学习算法,如相似性搜索和嵌入技术,来优化搜索结果,并提供带有引用来源的清晰答案。Perple...最新AI工具# AI开源项目# AI搜索工具7个月前01.6K
Scraperr:自托管网页数据抓取工具综合介绍 Scraperr 是一个自托管的网页数据抓取工具,用户可以通过指定 XPath 元素来抓取网页数据。用户提交 URL 和相应的抓取元素,结果将显示在表格中,并可下载为 Excel 文件。Sc...最新AI工具# AI开源项目7个月前01.1K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播综合介绍 Deep Live Cam 是一个开源的人工智能工具,旨在通过单张照片实现实时换脸和深度伪造视频生成。该工具利用先进的深度学习算法,能够在直播或视频通话中实时替换人脸,保护用户隐私并增加趣味...最新AI工具# AI开源项目# AI视频换脸7个月前01.7K
DH live:在30/40系显卡流畅实时交互的AI数字人综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可...最新AI工具# AI开源项目# AI数字人7个月前01.2K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧...最新AI工具# AI开源项目# AI文本转视频7个月前01.3K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据综合介绍 Crawl4AI 是一个开源的异步网页爬虫工具,专为大型语言模型(LLMs)和人工智能(AI)应用设计。它简化了网络爬虫和数据提取流程,支持高效的网页爬取,并提供对 LLM 友好的输出格式...最新AI工具# AI开源项目7个月前02K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档综合介绍 Cloud Document Converter 是一个 Chrome 扩展,专为将飞书云文档转换为 Markdown 格式而设计。用户可以通过该工具轻松下载或复制飞书云文档为 Markdo...最新AI工具# AI开源项目7个月前01.3K
AI Podcast Generator:自动抓取新闻生成音频播客综合介绍 AI 播客生成器是一个智能化的播客生成工具,利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容,生成自然流畅的叙述,并将其转换为音频播客。项目基于 Next...最新AI工具# AI开源项目# AI文本与音频/视频总结工具8个月前01.3K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件综合介绍 WhoDB 是一个轻量级(约20MB)、功能强大且用户友好的数据库管理工具,旨在简化数据库管理任务。它结合了 Adminer 的简洁性,并在用户体验和性能上进行了增强。WhoDB 使用 Go...最新AI工具# AI开源项目# AI数据分析8个月前01.1K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师综合介绍 CR-Mentor 是一个结合专业知识库与大语言模型(LLM)能力的智能代码审查工具。它不仅支持所有编程语言的代码审查,还能基于知识库积累的最佳实践,为团队定制专属审查标准和重点关注领域。通...最新AI工具# AI开源项目# AI编程8个月前01.3K
Pyramid Flow:快手推出的开源版"可灵",基于SD3在少于8GB的GPU上运行(一键部署版)综合介绍 Pyramid Flow 是一种高效的自回归视频生成方法,基于 Flow Matching 技术。该方法通过在不同分辨率和噪声水平之间插值,实现了视频内容的生成和解压缩,具有更高的计算效率...最新AI工具# AI图像转视频# AI开源项目8个月前01.2K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架综合介绍 muAgent 是由蚂蚁集团开发的创新型多智能体框架。该框架通过画布式拖拽和简单的文本编写,协同多智能体、函数调用、代码解释器等技术,帮助用户在人工指导下执行各种复杂的标准操作流程(SOP...最新AI工具# AI开源项目# 智能体开发框架8个月前01.2K
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API综合介绍 DDG-Chat 是一个开源项目,旨在提供一个可以一键部署到多种平台的 ChatGPT API 后端。该项目支持多种模型,包括 GPT-4o mini、Claude 3 Haiku、Llam...最新AI工具# AI开源项目# 免费大模型API8个月前01.6K