AI开源项目 - 第26页

排序

发布更新浏览点赞

LangBot：开源大模型即时通信机器人，支持多微信、QQ、飞书等多平台部署AI机器人

综合介绍 LangBot 是一个基于大模型的即时通信机器人平台，支持多种消息平台和大模型。该平台适配 QQ、微信（企业微信、个人微信）、飞书、Discord、OneBot 等消息平台，并支持 Open...

最新AI工具 # AI开源项目

4个月前

0918

茴香豆：基于LLM(大型语言模型) 的群聊助手

综合介绍 HuixiangDou 是一个基于大型语言模型（LLM）的群聊助手，旨在通过三阶段的预处理、拒绝和响应流程来应对群聊场景。它能够在不造成信息泛滥的情况下回答用户问题。该项目提供了完整的Web...

最新AI工具 # AI开源项目

4个月前

01.3K

LiberSonora：有声书字幕提取与多语言翻译，有声小说转录为多语言

综合介绍 LiberSonora，寓意“自由的声音”，是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能，能够在GPU加速下进行批量离线处理。LiberSo...

最新AI工具 # AI开源项目 # AI翻译 # AI语音转文本

4个月前

0722

go-stock：AI赋能股票分析工具，自选股行情实时监控并基于AI深度分析

综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情，提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地，确保用户...

最新AI工具 # AI开源项目 # AI金融数据分析

4个月前

0788

SiYuan（思源笔记）：隐私优先的个人知识管理软件，支持AI写作/问答聊天

综合介绍：思源笔记（SiYuan）是一款隐私优先的个人知识管理软件，完全开源并支持自托管。它采用TypeScript和Golang编写，提供细粒度的块级引用和Markdown所见即所得（WYSIWY...

最新AI工具 # AI开源项目 # AI笔记

4个月前

01.5K

Cherry Studio：集成API/Web/本地模型的AI助手桌面客户端

综合介绍 Cherry Studio 是一款支持多种大语言模型（LLM）服务的桌面客户端，兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计，帮助用户在多种场...

最新AI工具 # AI开源项目 # AI本地化聊天应用

4个月前

02.6K

RSS Translator（RSS翻译器）：订阅并实时翻译RSS内容的工具

综合介绍 RSS Translator 是一个开源、简洁且可自部署的工具，旨在帮助用户实时翻译和订阅RSS内容。该工具支持多种翻译引擎，包括Google Translate、Microsoft Tra...

最新AI工具 # AI开源项目 # AI翻译

4个月前

0841

NextChat：兼容多平台的本地化AI聊天助手

综合介绍 NextChat是一项革命性的AI聊天服务，允许用户部署与GPT-3、GPT-4、GPT-4.5和Gemini Pro等一流语言模型的聊天服务。它提供了优雅的用户界面、协作特性、集成、模板和...

最新AI工具 # AI开放服务 # AI开源项目 # AI本地化聊天应用

4个月前

01.5K

KTransformers：大模型推理性能引擎：极致加速，灵活赋能

综合介绍 KTransformers：专为突破大模型推理瓶颈而生的高性能 Python 框架。它不仅仅是一个简单的模型运行工具，更是一套极致的性能优化引擎和灵活的接口赋能平台。 KTransf...

最新AI工具 # AI开源项目

4个月前

01.1K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

综合介绍 Coqui TTS 是一个开源的高级文本到语音（TTS）生成工具包，基于深度学习技术。它经过研究和生产环境的实战测试，提供了丰富的功能和模型，支持多种语言的文本到语音转换。Coqui TTS...

最新AI工具 # AI开源项目 # AI语音克隆

4个月前

01.5K

Hibiki：实时语音翻译模型，保留原声特点的流式翻译

综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同，Hibiki 能够在用户讲话的同时，实时生成目标语言的自然语音翻译，并提供文本翻译。该模...

最新AI工具 # AI开源项目 # AI翻译

4个月前

0930

VideoRAG：理解超长视频的RAG框架，支持多模态检索和知识图谱构建

综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码，能够在单个NVIDIA RTX 3090 GPU上高效处理...

最新AI工具 # AI开源项目 # 知识检索与RAG框架

4个月前

0793

Instructor：简化大语言模型结构化输出工作流的Python库

综合介绍 Instructor 是一个流行的 Python 库，专为处理大语言模型（LLMs）的结构化输出而设计。它基于 Pydantic 构建，提供了一个简单、透明且用户友好的 API，用于管理数据...

最新AI工具 # AI开源项目 # 文档提取与清洗

4个月前

0772

Outlines：通过正则表达式、JSON或Pydantic模型生成结构化文本输出

综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库，旨在通过结构化文本生成来提升大语言模型（LLM）的应用能力。该库支持多种模型集成，包括 OpenAI、transformers...

最新AI工具 # AI开源项目 # 文档提取与清洗

4个月前

01.2K

Llasa 1~8B：高品质语音生成和克隆的开源文本转语音模型

综合介绍 Llasa-3B是由香港科技大学音频实验室（HKUST Audio）开发的一个开源文本转语音（TTS）模型。该模型基于Llama 3.2B架构，经过细致调优，提供高质量的语音生成，不仅支持多...

最新AI工具 # AI开源项目 # AI文本转语音 # AI语音克隆

4个月前

01.2K

OuteTTS：实验性文本转语音模型，使用纯语言建模方法实现的TTS

综合介绍 OuteTTS 是一种实验性文本转语音（TTS）模型，采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同，OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...

最新AI工具 # AI开源项目 # AI文本转语音

4个月前

01.4K

F5-TTS：少样本语音克隆，生成流畅且感情丰富的克隆声音

综合介绍 F5-TTS 是一种新型非自回归文本到语音（TTS）系统，基于流匹配的扩散变换器（Diffusion Transformer, DiT）。该系统通过使用 ConvNeXt 模型来优化文本表示...

最新AI工具 # AI开源项目 # AI语音克隆

4个月前

01.9K

Parler-TTS：根据输入文本生成特定说话人风格的文本转语音模型

综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音（TTS）模型库，旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格（如性别、音调、说话风...

最新AI工具 # AI开源项目 # AI文本转语音

4个月前

0813

CosyVoice：阿里推出的3秒急速语音克隆开源项目，支持情感控制标签

综合介绍 CosyVoice是一个多语言大规模语音生成模型，提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发，旨在通过先进的自回归变换器和基于ODE的扩散模型，实现高质量的语音...

最新AI工具 # AI开源项目 # AI语音克隆

4个月前

02.2K

加载更多