Fish Speech:快速且高精度使用少样本克隆中英文语音综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音(TTS)合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术,能够将文本转换成逼真的语音。Fish S...最新AI工具# AI开源项目# AI语音克隆4个月前01.5K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS...最新AI工具# AI开源项目# AI文本转语音4个月前0725
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)综合介绍 ChatTTS 是一个专为对话场景设计的生成语音模型。它能够生成自然且富有表现力的语音,支持多种语言和多位说话者,适用于互动对话。该模型通过预测和控制细粒度的韵律特征,如笑声、停顿和插话,超...最新AI工具# AI开源项目# AI文本转语音4个月前01.5K
zChunk:基于Llama-70B的通用语义分块策略综合介绍 zChunk是由ZeroEntropy开发的一种新型分块策略,旨在为通用语义分块提供解决方案。该策略基于Llama-70B模型,通过提示生成分块,优化了文档的分块过程,确保在信息检索时保持高...最新AI工具# AI开源项目# 文档提取与清洗4个月前0663
Chonkie:轻量级RAG文本切块库综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包...最新AI工具# AI开源项目# 文档提取与清洗4个月前01.4K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话综合介绍 Qwen4Mac是一个开源项目,旨在将Qwen大语言模型(LLM)集成到Mac的菜单栏中,方便用户随时调用和使用。该项目由andreaturchet开发和维护,提供了一种简便的方式,让用户能...最新AI工具# AI开源项目4个月前0682
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)综合介绍 口袋AI(PocketPal AI 中文版)是一款强大的离线AI助手,旨在让用户随时随地与AI进行对话。该项目基于小型语言模型(SLMs),无需联网即可在手机上运行,特别适配中文用户体验。口...最新AI工具# AI开源项目# AI本地化聊天应用4个月前0979
Kokoro WebGPU:浏览器中离线运行的文本转语音服务综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能...最新AI工具# AI开源项目# AI文本转语音4个月前0974
Unsloth:高效微调和训练大语言模型的开源工具综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...最新AI工具# AI开源项目# 大模型微调4个月前01.1K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...最新AI工具# AI开源项目# 视觉目标检测4个月前01.4K
CogVLM2:开源多模态模型,支持视频理解与多轮对话综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...最新AI工具# AI开源项目# 视觉目标检测4个月前0784
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划综合介绍 OpenHealthForAll 是一个开源项目,旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术,OpenHealthForAll 提供了一个本地运行的健康助手,帮助用户更好地管理...最新AI工具# AI开源项目# AI生活效率助手4个月前0828
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...最新AI工具# AI开源项目4个月前0928
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天综合介绍 OpenAOE 是一个开源的大模型群聊框架,旨在解决当前市场上缺乏多模型并行响应的聊天框架的问题。通过 OpenAOE,用户可以同时与多个大语言模型(LLM)进行对话,获取并行输出。该框架支...最新AI工具# AI开源项目# AI集成多模型对话平台4个月前0695
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...最新AI工具# AI开源项目# prompt越狱4个月前0710
基于RAG构建提供健康建议的小助手(实验项目)综合介绍 LLM-RAG-Longevity-Coach 是一个基于大语言模型(LLM)和检索增强生成(RAG)技术的聊天机器人,旨在为用户提供个性化的健康和长寿建议。该项目由 Tyler Burle...最新AI工具# AI开源项目# AI生活效率助手4个月前0829
Maestro:简化主流开源视觉语言模型微调过程的工具综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 F...最新AI工具# AI开源项目# 大模型微调4个月前0881
One-Prompt-One-Story:文本提示生成角色身份一致的图像综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具,旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...最新AI工具# AI图像风格控制# AI开源项目4个月前0874
为Next.js应用程序添加RAG驱动的在线聊天工具综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件,旨在提供基于RAG(检索增强生成)技术的AI聊天界面。该组件结合了Upstash V...最新AI工具# AI开源项目4个月前0788