排序

发布更新浏览点赞

llm.pdf：在PDF文件中运行大型语言模型的实验项目

综合介绍 llm.pdf 是一个开源项目，允许用户在 PDF 文件中直接运行大型语言模型（LLM）。这个项目由 EvanZhouDev 开发，托管在 GitHub 上，展示了一种创新的方法：通过 Em...

最新AI工具 # AI开源项目 # 本地部署开源大模型工具

1个月前

02430

CAD-MCP：通过自然语言指令控制CAD软件的MCP服务

综合介绍 CAD-MCP 是一个开源项目，允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术，让用户无需手动操作 CAD 界面，只需输入简单的文字命令即...

最新AI工具 # AI开源项目 # MCP服务

1个月前

02760

Abogen：将多种文本格式转换为有声读物的工具

综合介绍 Abogen 是一个开源工具，专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音，同时支持同步字幕生成，适合制作有声读物...

最新AI工具 # AI开源项目 # AI语音转文本

1个月前

02350

Local Deep Research：本地运行的生成深度研究报告工具

综合介绍 Local Deep Research 是一个开源的人工智能研究助手，旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行，使用户可以在不依赖云服务的情况下完成研究任务。工具...

最新AI工具 # AI开源项目 # 生成深度研究报告

1个月前

02680

DeepWiki：自动生成GitHub仓库文档并用AI对话

综合介绍 DeepWiki 是一个由 Cognition AI 推出的免费工具，专注于为 GitHub 仓库生成结构化、类似维基百科的文档。它通过分析代码、README 文件和配置文件，自动创建详细的...

最新AI工具 # AI搜索工具

1个月前

02700

Trackers：用于视频对象跟踪的开源工具库

综合介绍 Trackers 是一个开源的 Python 工具库，专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法，如 SORT 和 DeepSORT，允许用户结合不同的对象检测模型（如 YOLO...

最新AI工具 # AI开源项目 # 视觉目标检测

1个月前

02480

Kimi-Audio：开源音频处理与对话基础模型

综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型，专注于音频理解、生成和对话。它支持多种音频处理任务，例如语音识别、音频问答和语音情感识别。模型经过超过 130...

最新AI工具 # AI开源项目 # AI文本转语音 # AI语音转文本

1个月前

02810

Describe Anything：为图像和视频区域生成详细描述的开源工具

综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目，核心是 Describe Anything Model（DAM）。这个工具能根据用户在图像或视频中标记的...

最新AI工具 # AI开源项目 # 视觉目标检测

1个月前

02370

Cooragent：一句话构建多智能体任务协作工具

综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架，托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理，并支持多个代理协作完成复杂任务。框架提供两...

最新AI工具 # AI开源项目 # 智能体开发框架

1个月前

02430

InstantCharacter：从单张图片生成一致性角色的开源工具

综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目，托管在 GitHub 上。它通过一张参考图片和一句文本描述，就能生成外观一致的角色图...

最新AI工具 # AI图像风格控制 # AI开源项目

1个月前

02600

Claude生成深度研究报告的MCP服务

综合介绍 MCP Server Deep Research 是一个开源工具，通过人工智能和网页搜索，自动为复杂问题生成结构化的研究报告。用户输入研究问题，工具会分解问题、搜索权威信息、评估来源可信度...

最新AI工具 # AI开源项目 # MCP服务 # 生成深度研究报告

1个月前

02470

Deep Recall：为大模型提供企业级记忆框架的开源工具

综合介绍 Deep Recall 是一个开源的企业级记忆框架，专为大型语言模型（LLM）设计。它通过高效的上下文检索和整合，提供超个性化的响应能力。框架采用三层架构，包括记忆服务、推理服务和协调器，支...

最新AI工具 # AI开源项目 # 知识检索与RAG框架

1个月前

02270

CleverBee：开源AI研究助手，生成引证研究报告

综合介绍 CleverBee 是一个开源的 AI 研究助手，托管在 GitHub 上，由 SureScaleAI 开发。它通过大语言模型（如 Gemini 和 Claude）结合网页浏览技术，帮助用户...

最新AI工具 # AI开源项目 # 生成深度研究报告

1个月前

02310

FantasyTalking：生成真实感说话肖像的开源工具

综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目，专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1，结合音频编码器 Wa...

最新AI工具 # AI开源项目 # AI数字人

1个月前

02460

Paper2Code：将机器学习论文自动转化为可运行代码

综合介绍 Paper2Code 是一个开源项目，旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型（LLM）系统 PaperCoder，将科学论文自动转化为可运行的代码仓库。系统采用规划...

最新AI工具 # AI开源项目 # 智能体应用

1个月前

02780

DeepWiki-Open：为GitHub、GitLab仓库自动生成AI文档

综合介绍 DeepWiki-Open 是一个开源项目，专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系，快速生...

最新AI工具 # AI开源项目

1个月前

02470

Audibit：将热门科技文章转为随时收听的音频播客

综合介绍 Audibit 是一个开源项目，核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客，让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使...

最新AI工具 # AI开源项目 # AI文本转语音

1个月前

02430

Little Language Lessons：基于AI的小型英语学习实验工具

综合介绍 Google Labs的Little Language Lessons（简称LLL）是一个基于Gemini AI的交互式英语学习平台，提供一系列小型实验，帮助用户通过趣味对话和场景练习提升英...

最新AI工具 # AI教育工具

1个月前

03010

FramePack：6G低显存快速生成长视频的开源项目

综合介绍 FramePack 是一个开源的视频生成工具，专注于让视频扩散技术更实用。它通过独特的下一帧预测神经网络，将输入帧压缩到固定长度，使生成工作量与视频长度解耦。这意味着即使生成长视频，显存需求...

最新AI工具 # AI图像转视频 # AI开源项目

1个月前

03250

加载更多