LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人综合介绍 LangBot 是一个基于大模型的即时通信机器人平台,支持多种消息平台和大模型。该平台适配 QQ、微信(企业微信、个人微信)、飞书、Discord、OneBot 等消息平台,并支持 Open...最新AI工具# AI开源项目4个月前0918
茴香豆:基于LLM(大型语言模型) 的群聊助手综合介绍 HuixiangDou 是一个基于大型语言模型(LLM)的群聊助手,旨在通过三阶段的预处理、拒绝和响应流程来应对群聊场景。它能够在不造成信息泛滥的情况下回答用户问题。该项目提供了完整的Web...最新AI工具# AI开源项目4个月前01.3K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言综合介绍 LiberSonora,寓意“自由的声音”,是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能,能够在GPU加速下进行批量离线处理。LiberSo...最新AI工具# AI开源项目# AI翻译# AI语音转文本4个月前0722
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情,提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地,确保用户...最新AI工具# AI开源项目# AI金融数据分析4个月前0788
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天综合介绍: 思源笔记(SiYuan)是一款隐私优先的个人知识管理软件,完全开源并支持自托管。它采用TypeScript和Golang编写,提供细粒度的块级引用和Markdown所见即所得(WYSIWY...最新AI工具# AI开源项目# AI笔记4个月前01.5K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端综合介绍 Cherry Studio 是一款支持多种大语言模型(LLM)服务的桌面客户端,兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计,帮助用户在多种场...最新AI工具# AI开源项目# AI本地化聊天应用4个月前02.6K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具综合介绍 RSS Translator 是一个开源、简洁且可自部署的工具,旨在帮助用户实时翻译和订阅RSS内容。该工具支持多种翻译引擎,包括Google Translate、Microsoft Tra...最新AI工具# AI开源项目# AI翻译4个月前0841
NextChat:兼容多平台的本地化AI聊天助手综合介绍 NextChat是一项革命性的AI聊天服务,允许用户部署与GPT-3、GPT-4、GPT-4.5和Gemini Pro等一流语言模型的聊天服务。它提供了优雅的用户界面、协作特性、集成、模板和...最新AI工具# AI开放服务# AI开源项目# AI本地化聊天应用4个月前01.5K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能综合介绍 KTransformers:专为突破大模型推理瓶颈而生的高性能 Python 框架。 它不仅仅是一个简单的模型运行工具,更是一套 极致的性能优化引擎 和 灵活的接口赋能平台。 KTransf...最新AI工具# AI开源项目4个月前01.1K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能综合介绍 Coqui TTS 是一个开源的高级文本到语音(TTS)生成工具包,基于深度学习技术。它经过研究和生产环境的实战测试,提供了丰富的功能和模型,支持多种语言的文本到语音转换。Coqui TTS...最新AI工具# AI开源项目# AI语音克隆4个月前01.5K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI工具# AI开源项目# AI翻译4个月前0930
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI工具# AI开源项目# 知识检索与RAG框架4个月前0793
Instructor:简化大语言模型结构化输出工作流的Python库综合介绍 Instructor 是一个流行的 Python 库,专为处理大语言模型(LLMs)的结构化输出而设计。它基于 Pydantic 构建,提供了一个简单、透明且用户友好的 API,用于管理数据...最新AI工具# AI开源项目# 文档提取与清洗4个月前0772
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库,旨在通过结构化文本生成来提升大语言模型(LLM)的应用能力。该库支持多种模型集成,包括 OpenAI、transformers...最新AI工具# AI开源项目# 文档提取与清洗4个月前01.2K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多...最新AI工具# AI开源项目# AI文本转语音# AI语音克隆4个月前01.2K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...最新AI工具# AI开源项目# AI文本转语音4个月前01.4K
F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示...最新AI工具# AI开源项目# AI语音克隆4个月前01.9K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音(TTS)模型库,旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格(如性别、音调、说话风...最新AI工具# AI开源项目# AI文本转语音4个月前0813
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签综合介绍 CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音...最新AI工具# AI开源项目# AI语音克隆4个月前02.2K