Kimi-Audio:开源音频处理与对话基础模型
综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 130...
Describe Anything:为图像和视频区域生成详细描述的开源工具
综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的...
Cooragent:一句话构建多智能体任务协作工具
综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两...
InstantCharacter:从单张图片生成一致性角色的开源工具
综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图...
Claude生成深度研究报告的MCP服务
综合介绍 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度...
Deep Recall:为大模型提供企业级记忆框架的开源工具
综合介绍 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支...
CleverBee:开源AI研究助手,生成引证研究报告
综合介绍 CleverBee 是一个开源的 AI 研究助手,托管在 GitHub 上,由 SureScaleAI 开发。它通过大语言模型(如 Gemini 和 Claude)结合网页浏览技术,帮助用户...
FantasyTalking:生成真实感说话肖像的开源工具
综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目,专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1,结合音频编码器 Wa...
Paper2Code:将机器学习论文自动转化为可运行代码
综合介绍 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划...
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档
综合介绍 DeepWiki-Open 是一个开源项目,专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系,快速生...