百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流综合介绍 百聆(Bailing)是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,实现了...最新AI工具# AI开源项目# 多模态实时互动产品6个月前01.4K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建,旨在通过收集和处理来自 YouTube 的说唱歌曲,为研究人员和开发者提供一个高质量的说唱歌词数据...最新AI工具# AI开源项目# AI音乐8个月前01.4K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI工具# AI开源项目# AI语音转文本# AI音视频编辑7个月前01.4K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。综合介绍 Qwen-Agent 是一个基于 Qwen 2.0 及以上版本开发的智能代理应用框架,具备指令跟随、工具使用、规划和记忆等能力。该框架提供了多种示例应用,如浏览器助手、代码解释器和自定义助手...最新AI工具# AI开源项目# 智能体开发框架8个月前01.4K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型综合介绍 CodeArena 是一个独特的平台,旨在通过实时对决展示最佳开源代码生成模型(LLM)。用户可以观看不同的LLM在相同的编程任务中竞争,并通过实时排行榜查看表现最佳的模型。该平台利用Tog...最新AI工具# AI开源项目8个月前01.4K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人综合介绍 NGCBot 是一个基于 HOOK 机制开发的微信机器人开源项目,由开发者 ngc660sec(云山/eXM)创建并托管于 GitHub。经过两年迭代,目前版本为 V2.3,功能从最初的简单...最新AI工具# AI客服机器人# AI开源项目5个月前01.4K
XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目综合介绍 小猿口算自动答题工具是一个基于Python的开源项目,旨在通过OCR识别和自动化脚本来高效解决小猿口算应用中的题目。该工具利用了OpenCV和Tesseract等技术,能够实时识别屏幕上的题...最新AI工具# AI开源项目# AI教育工具10个月前01.4K
Data Formulator:AI驱动的数据可视化工具综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面(GUI)和自然语言输入(NL),使用户能够通过简单的交互和指令,快速创建和迭代...最新AI工具# AI开源项目# AI数据分析6个月前01.4K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI工具# AI开源项目# 桌面自动化智能体7个月前01.4K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象综合介绍 OASIS(Open Agent Social Interaction Simulations)是一个开源的社交媒体模拟器,能够模拟多达一百万用户的行为。该平台结合了大型语言模型和基于规则的...最新AI工具# AI开源项目# 智能体应用5个月前01.4K
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目,旨在通过“Modality-specific Normalization for Virtual Try-On”(MNVTON)技术...最新AI工具# AI开源项目# AI换脸与换装6个月前01.4K
Dify 工作流 DSL 文件合集下载综合介绍 Awesome-Dify-Workflow 是一个开源的 GitHub 项目,专注于分享实用的 Dify 工作流程模板。Dify 是一个支持开发大语言模型应用的工作流平台,而这个项目为用户提...最新AI工具# AI开源项目4个月前01.4K
Orama:高性能全文本和向量搜索引擎综合介绍 Orama 是一个开源的高性能搜索引擎,完全用 TypeScript 编写,支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作,提供快速、可靠...最新AI工具# AI开源项目# 知识检索与RAG框架6个月前01.4K
xyks:小猿口算逆向笔记,逆向工程与解密算法综合介绍 小猿口算逆向笔记是一个开源项目,旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明,如Frida、dexdump等,帮助用户了解和破解小猿口算的加...最新AI工具# AI开源项目# AI教育工具10个月前01.4K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。综合介绍 Research Rabbit 是一个基于本地LLM(大语言模型)的网页研究和总结助手。用户提供研究主题后,Research Rabbit 会生成搜索查询,获取相关网页结果,并总结这些结果...最新AI工具# AI开源项目# 生成深度研究报告4个月前01.3K
Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...最新AI工具# AI开源项目# 文档提取与清洗7个月前01.3K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程综合介绍 ComfyUI-disty-Flow 是一个为 ComfyUI 提供用户友好界面的自定义节点。它旨在通过提供替代用户界面来简化工作流程的运行,而不是替代工作流程的创建。ComfyUI-dis...最新AI工具# AI图像生成辅助工具# AI开源项目# ComfyUI6个月前01.3K
Unsloth:高效微调和训练大语言模型的开源工具综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...最新AI工具# AI开源项目# 大模型微调6个月前01.3K
infinite-zoom-stable-diffusion:生成无限缩放循环视频综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...最新AI工具# AI开源项目# AI视频转换风格6个月前01.3K