llm.pdf:在PDF文件中运行大型语言模型的实验项目综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em...最新AI工具# AI开源项目# 本地部署开源大模型工具1个月前02430
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务综合介绍 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即...最新AI工具# AI开源项目# MCP服务1个月前02760
Abogen:将多种文本格式转换为有声读物的工具综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...最新AI工具# AI开源项目# AI语音转文本1个月前02350
Local Deep Research:本地运行的生成深度研究报告工具综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具...最新AI工具# AI开源项目# 生成深度研究报告1个月前02680
DeepWiki:自动生成GitHub仓库文档并用AI对话综合介绍 DeepWiki 是一个由 Cognition AI 推出的免费工具,专注于为 GitHub 仓库生成结构化、类似维基百科的文档。它通过分析代码、README 文件和配置文件,自动创建详细的...最新AI工具# AI搜索工具1个月前02700
Trackers:用于视频对象跟踪的开源工具库综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO...最新AI工具# AI开源项目# 视觉目标检测1个月前02480
Kimi-Audio:开源音频处理与对话基础模型综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 130...最新AI工具# AI开源项目# AI文本转语音# AI语音转文本1个月前02810
Describe Anything:为图像和视频区域生成详细描述的开源工具综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的...最新AI工具# AI开源项目# 视觉目标检测1个月前02370
Cooragent:一句话构建多智能体任务协作工具综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两...最新AI工具# AI开源项目# 智能体开发框架1个月前02430
InstantCharacter:从单张图片生成一致性角色的开源工具综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图...最新AI工具# AI图像风格控制# AI开源项目1个月前02600
Claude生成深度研究报告的MCP服务综合介绍 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度...最新AI工具# AI开源项目# MCP服务# 生成深度研究报告1个月前02470
Deep Recall:为大模型提供企业级记忆框架的开源工具综合介绍 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支...最新AI工具# AI开源项目# 知识检索与RAG框架1个月前02270
CleverBee:开源AI研究助手,生成引证研究报告综合介绍 CleverBee 是一个开源的 AI 研究助手,托管在 GitHub 上,由 SureScaleAI 开发。它通过大语言模型(如 Gemini 和 Claude)结合网页浏览技术,帮助用户...最新AI工具# AI开源项目# 生成深度研究报告1个月前02310
FantasyTalking:生成真实感说话肖像的开源工具综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目,专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1,结合音频编码器 Wa...最新AI工具# AI开源项目# AI数字人1个月前02460
Paper2Code:将机器学习论文自动转化为可运行代码综合介绍 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划...最新AI工具# AI开源项目# 智能体应用1个月前02780
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档综合介绍 DeepWiki-Open 是一个开源项目,专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系,快速生...最新AI工具# AI开源项目1个月前02470
Audibit:将热门科技文章转为随时收听的音频播客综合介绍 Audibit 是一个开源项目,核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客,让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使...最新AI工具# AI开源项目# AI文本转语音1个月前02430
Little Language Lessons:基于AI的小型英语学习实验工具综合介绍 Google Labs的Little Language Lessons(简称LLL)是一个基于Gemini AI的交互式英语学习平台,提供一系列小型实验,帮助用户通过趣味对话和场景练习提升英...最新AI工具# AI教育工具1个月前03010
FramePack:6G低显存快速生成长视频的开源项目综合介绍 FramePack 是一个开源的视频生成工具,专注于让视频扩散技术更实用。它通过独特的下一帧预测神经网络,将输入帧压缩到固定长度,使生成工作量与视频长度解耦。这意味着即使生成长视频,显存需求...最新AI工具# AI图像转视频# AI开源项目1个月前03250