GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释综合介绍 GPT Academic 是一个专门为学术研究优化的大语言模型交互平台,为 GPT/GLM 等大语言模型提供实用化交互接口的工具,特别优化了论文翻译、论文阅读、润色和写作体验。它采用模块化设...最新AI工具# AI开源项目# AI教育工具# 论文7个月前01.3K0
Open Deep Research:生成基于网络搜索内容的AI研究报告综合介绍 Open Deep Research是一个开源的AI驱动研究报告生成工具,作为Google Gemini深度研究功能的开源替代方案。该项目采用TypeScript开发,基于Next.js 1...最新AI工具# AI开源项目# 生成深度研究报告2个月前01.3K0
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量...最新AI工具# AI开源项目# AI文本转语音5个月前01.3K0
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告综合介绍 STORM是由斯坦福大学 Oval 团队开发的一个知识整合和文章生成系统。它专注于从头开始生成类似维基百科的详尽文章(成体系的论文)。系统利用大型语言模型进行话题研究,准备概要并模拟实际互联...最新AI工具# AI开源项目# 生成深度研究报告# 论文2个月前01.3K0
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全综合介绍 NSFW Detector 是一个基于 AI 的不适内容检测工具,主要用于检测图像、视频、PDF 文件等是否包含不适内容。该工具采用了 Falconsai/nsfwimagedetectio...最新AI工具# AI图像生成辅助工具# AI开源项目6个月前01.3K0
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI工具# AI开源项目# AI文本与音频/视频总结工具5个月前01.3K0
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...最新AI工具# AI开源项目# AI文本转语音4个月前01.3K0
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑综合介绍 Aider是一款强大的开源AI编程助手工具,它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具,Aider支持多种主流编程语言,可以无缝集成到Git...最新AI工具# AI开源项目# AI编程2个月前01.3K0
HivisionIDPhotos:开源智能AI证件照制作工具综合介绍 HivisionIDPhotos 是一款开源的轻量级 AI 证件照制作工具,能够智能识别用户拍照场景并进行抠图,生成符合多种规格的标准证件照。该工具支持自定义背景色和尺寸,未来还将推出美颜和...最新AI工具# AI开源项目# AI抠图改背景9个月前01.3K0
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)综合介绍 Dify Connect MCP 是一个开源项目,托管在 GitHub 上,旨在为 Dify 平台的用户提供一个便捷的工具,通过模型上下文协议(Model Context Protocol...最新AI工具# AI开源项目# MCP服务3个月前01.3K0
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...最新AI工具# AI开源项目# AI教育工具# AI文本转视频8个月前01.3K0
推荐Github优秀开源下载工具在互联网高速发展的今天,下载工具作为用户获取信息和资源的重要手段,扮演着不可或缺的角色。本文将系统分析五款开源下载工具:AB Download Manager、XDM(Xtreme Download ...最新AI工具# AI开源项目8个月前01.3K0
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI工具# AI开源项目# AI语音转文本5个月前01.3K0
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库综合介绍 OpenAI Realtime WebRTC Python是一个专业的Python库,为开发者提供了与OpenAI实时API进行语音交互的完整解决方案。该项目基于WebRTC技术,实现了低延...最新AI工具# AI开源项目5个月前01.3K0
RTranslator:语音实时翻译安卓应用,免费且支持离线使用综合介绍 RTranslator 是一款几乎开源的免费离线实时翻译应用,专为 Android 设备设计。用户可以通过连接蓝牙耳机,将手机放在口袋中,与他人进行如同对方说自己语言的对话。RTransla...最新AI工具# AI开源项目# AI翻译5个月前01.3K0
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低...最新AI工具# AI开源项目# AI语音克隆8个月前01.3K0
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...最新AI工具# AI图像风格控制# AI开源项目5个月前01.3K0
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习综合介绍 Cognee是一个专为AI应用和AI代理设计的可靠数据层解决方案。旨在加载和构建LLM(大型语言模型)上下文,通过知识图谱和向量存储创建准确和可解释的AI解决方案。该框架有利于成本节约、可解...最新AI工具# AI开源项目# 知识图谱# 知识检索与RAG框架5个月前01.3K0
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Ch...最新AI工具# AI开源项目9个月前01.3K0