BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI工具# AI开源项目# AI语音转文本7个月前01.5K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI工具# AI大模型原生对话工具# AI开源项目8个月前01.5K
QAnything:高度集成RAG处理流程的本地知识库问答系统QAnything 综合介绍 QAnything(Question and Answer based on Anything)是由网易推出的本地知识库问答系统,支持各类文件格式及数据库,可离线安装使用...最新AI工具# AI开放服务# AI开源项目# 知识检索与RAG框架10个月前01.5K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用综合介绍 RocketNotes 是一个基于 Web 的 Markdown 笔记应用程序,集成了大型语言模型(LLM)驱动的文本补全、聊天和语义搜索功能。该项目采用 100% 无服务器的 RAG(Re...最新AI工具# AI开源项目# AI笔记8个月前01.5K
FlowiseAI:构建自定义LLM应用的节点拖放界面综合介绍 FlowiseAI 是一个开源的低代码工具,旨在帮助开发者构建自定义的LLM(大语言模型)应用和AI代理。通过简单的拖放界面,用户可以快速创建和迭代LLM应用,从测试到生产的过程变得更加高效...最新AI工具# AI开源项目# 低代码工作流6个月前01.5K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载综合介绍 Comics Downloader 是一个开源工具,旨在帮助用户从各种网站下载漫画和漫画书。该工具支持多种文件格式,包括 PDF、EPUB、CBR 和 CBZ,使用户能够根据自己的需求选择合...最新AI工具# AI开源项目7个月前01.5K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...最新AI工具# AI图像风格控制# AI开源项目7个月前01.5K
Zed:Rust开发的高性能多人协作代码编辑器综合介绍 Zed 是由 Atom 和 Tree-sitter 的创造者开发的一款高性能、多用户协作的代码编辑器。Zed 采用 Rust 语言编写,旨在提供快速、流畅的编码体验。其主要特点包括支持多人实...最新AI工具# AI IDE# AI开源项目# AI编程8个月前01.5K
PDF to Podcast:将PDF转换为播客的实用工具综合介绍 受 Notebook LM 的播客生成特性和最近的 Open Notebook LM 开源实现的启发。在本食谱中,我们将实现一个关于如何构建 PDF 到播客管道的详细步骤。 给定任何 PDF...最新AI工具# AI开源项目9个月前01.5K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI工具# AI开源项目# 多模态实时互动产品6个月前01.5K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程综合介绍 MetaGPT 是一个创新的多智能体框架,旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan(Alexander Wu)创建,目标是将不同角色的GPT模型组合成一个协作实体...最新AI工具# AI开源项目# AI编程# 智能体开发框架5个月前01.5K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI工具# AI开源项目8个月前01.5K
Browse AI:无代码提取和监控结构化数据Browse介绍 Browse AI是一个无需编码的云端网页自动化软件,旨在帮助用户无需编程便能从任意网站提取和监控数据。您只需用鼠标指点一次,就可以训练一个机器人来执行数据提取、监控和自动化的任务...最新AI工具# AI开放服务# AI开源项目# 无代码开发11个月前01.5K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程,该工具能够使模型进行更深入的思考,从而提高其回答的质...最新AI工具# AI开源项目6个月前01.5K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能综合介绍 MiniPerplx(更名为Scira)是一个极简主义设计的AI驱动搜索引擎,它整合了多种实用功能,为用户提供全方位的信息检索服务。该项目采用现代化的技术栈,包括Next.js、Tailwi...最新AI工具# AI开源项目# AI搜索工具6个月前01.5K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低...最新AI工具# AI开源项目# AI语音克隆10个月前01.5K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard,专为简化集群管理设计。它基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客...最新AI工具# AI开源项目7个月前01.5K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库综合介绍 OpenAI Realtime WebRTC Python是一个专业的Python库,为开发者提供了与OpenAI实时API进行语音交互的完整解决方案。该项目基于WebRTC技术,实现了低延...最新AI工具# AI开源项目7个月前01.5K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API综合介绍 Gemini OpenAI API代理是一个免费且无需服务器维护的OpenAI兼容端点。用户可以轻松将其部署到Vercel、Netlify和Cloudflare等平台,适用于个人使用。该项目...最新AI工具# AI开源项目6个月前01.5K