MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架,旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型(LLM)与搜索引擎的先进技术,通过多智能体...最新AI工具# AI开源项目# AI搜索工具7个月前01.5K
sensitive-word:敏感词过滤工具,高效DFA算法实现综合介绍 敏感词过滤工具(Sensitive Word)是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词,支持多种格式转换和自定义替换策略。其设计目标是提供...最新AI工具# AI开源项目11个月前01.5K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Ch...最新AI工具# AI开源项目10个月前01.5K
InvSR:开源图像超分辨率项目,提升图像分辨率质量综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...最新AI工具# AI图像放大与修复# AI开源项目7个月前01.5K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...最新AI工具# AI开源项目# OCR# 免费大模型API8个月前01.5K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案综合介绍 NocoDB 是一个开源的Airtable替代方案,旨在提供一个强大且易于使用的在线数据库管理工具。通过NocoDB,用户可以轻松创建、读取、更新和删除数据库中的数据,无需编写代码。该平台支...最新AI工具# AI开源项目# AI数据分析9个月前01.5K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...最新AI工具# AI开源项目# 文档提取与清洗8个月前01.5K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索综合介绍 Hoarder 是一个自主托管的书签管理工具,支持链接、笔记、PDF和图像的存储。它利用 AI 技术进行自动标记,并提供全文搜索功能。用户可以通过 Chrome 插件和 Firefox 插件...最新AI工具# AI开源项目# AI生活效率助手7个月前01.5K
MemFree:本地知识库与搜索信息混合的AI搜索引擎综合介绍 MemFree 是一个先进的混合AI搜索引擎,能够通过文本、图像、文件和网页进行搜索和提问。它提供一键获取文本、思维导图、图像和视频的搜索结果的功能。MemFree 的目标是从用户的知识库和...最新AI工具# AI开源项目# AI搜索工具9个月前01.5K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力综合介绍 Dify-WebUI 是一个基于 Dify API 的现代化桌面智能对话应用,旨在为企业提供强大的 AI 对话能力。该应用支持多种预设主题颜色,满足企业个性化需求,并且具备知识库管理功能,支...最新AI工具# AI开源项目# AI本地化聊天应用7个月前01.5K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语...最新AI工具# AI开源项目# AI语音克隆# 多模态实时互动产品7个月前01.5K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用综合介绍 Steel Browser是一个开源的浏览器API,专为AI代理和应用程序设计。它提供了一个完整的浏览器实例,允许用户在不需要担心基础设施的情况下自动化网页操作。Steel Browser支...最新AI工具# AI开源项目8个月前01.5K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)综合介绍 OpenAI Realtime Agents是一个开源项目,旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式(借鉴 OpenAI Swarm),允许...最新AI工具# AI开源项目# 多模态实时互动产品6个月前01.5K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持综合介绍 知识图谱工作室(Knowledge Graph Studio)是一个开源平台,旨在简化创建和管理RAG-native知识图谱的过程。该平台提供了基于规则的实体解析、模块化图谱构建、灵活的数据...最新AI工具# AI开源项目# 知识图谱8个月前01.5K
VITA:开源视觉与语音实时交互的多模态大语言模型综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...最新AI工具# AI开源项目# 多模态实时互动产品7个月前01.5K
DCT-Net:照片和视频转绘为动漫风格化的开源工具综合介绍 DCT-Net 是一个由 DAMO 学院和北京大学王选计算机技术研究所共同开发的开源项目,旨在实现图像的动漫风格化转换。该项目利用深度学习技术,通过域校准翻译(Domain-Calibrat...最新AI工具# AI图像风格控制# AI开源项目# AI视频转换风格6个月前01.5K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统综合介绍 VideoReTalking是一款创新的系统,允许用户根据输入音频生成唇形同步的面部视频,即使有不同的情绪,也能产生高质量且嘴唇同步的输出视频。系统将这一目标分解为三个连续任务:带有典型表情...最新AI工具# AI开源项目# 口型同步8个月前01.5K
PromptWizard:优化提示工程的开源框架,提升任务性能综合介绍 PromptWizard是微软开发的一个开源框架,采用自我进化机制,可以让模型自己生成、评价和改进提示词及生成示例,通过不断反馈来提高输出质量。它能够自主优化提示词、生成和选择合适的示例、并...最新AI工具# AI开源项目7个月前01.5K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。综合介绍 AI Chatbot Supabase是一个基于Next.js和Supabase构建的开源AI聊天机器人模板。该项目由Vercel开发,旨在提供一个功能全面、可定制的聊天机器人解决方案。通过...最新AI工具# AI开源项目# 知识检索与RAG框架8个月前01.5K