Sim Studio: AIエージェントのためのオープンソースワークフロービルダー 综合介绍 Sim Studio 是一个开源的 AI 代理工作流构建平台,专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型(LLM)工作流。用户无需深入编程即可通过拖拽方式创建复... 最新AI工具# AI开源项目# 低代码工作流# 智能体开发框架 3天前02480
マッド・プロフェッサー:学術論文の読解と分析を支援するAIツール 综合介绍 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问... 最新AI工具# AI开源项目# AI教育工具 3周前02300
AIstudioProxyAPI: Gemini 2.5 ProモデルAPIを無制限に使用可能 综合介绍 AIstudioProxyAPI 是一个开源项目,使用 Node.js 和 Playwright 技术,通过模拟 OpenAI API 的方式,将 Google AI Studio 网页版的... 最新AI工具# AI开源项目# 免费大模型API 3周前02390
Step1X-Edit:自然言語指示による画像編集のためのオープンソースツール 综合介绍 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然... 最新AI工具# AI图像编辑# AI开源项目 3周前02250
Klavis AI: AIアプリケーションのためのモデルコンテキストプロトコル(MCP)統合ツール 综合介绍 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack... 最新AI工具# AI开源项目# MCP服务 3周前02110
RealtimeVoiceChat: AIとの低遅延自然音声対話 综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回... 最新AI工具# AI开源项目# 多模态实时互动产品 3周前02060
MiMo: 効率的な数学的推論とコード生成のための小さなオープンソースモデル 综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学... 最新AI工具# AI开源项目 3周前01980
Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成 综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3.2-3... 最新AI工具# AI开源项目# AI文本转语音 3周前01840
CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス 综合介绍 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即... 最新AI工具# AI开源项目# MCP服务 3周前01890
GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する 综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从... 最新AI工具# AI开源项目# 大模型微调# 知识图谱 3周前01530
ACI.DEV:MCPサーバーを介したAIインテリジェンスのための600以上のツールの統合 综合介绍 ACI.dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、S... 最新AI工具# AI开源项目# MCP服务 3周前01790
llm.pdf:大規模言語モデルをPDFファイルで実行する実験的プロジェクト 综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em... 最新AI工具# AI开源项目# 本地部署开源大模型工具 3周前01700
Abogen:複数のテキスト形式をオーディオブックに変換するツール 综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物... 最新AI工具# AI开源项目# AI语音转文本 3周前01670
ローカル・ディープ・リサーチ:詳細な調査レポートを作成するためのローカルで実行可能なツール 综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具... 最新AI工具# AI开源项目# 生成深度研究报告 3周前01850
Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ 综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO... 最新AI工具# AI开源项目# 视觉目标检测 3周前01870
Kimi-Audio:オープンソースの音声処理と対話ベースモデル 综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 130... 最新AI工具# AI开源项目# AI文本转语音# AI语音转文本 3周前01920
Describe Anything: 画像やビデオ領域の詳細な説明を生成するオープンソースツール 综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的... 最新AI工具# AI开源项目# 视觉目标检测 3周前01680
Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築 综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两... 最新AI工具# AI开源项目# 智能体开发框架 3周前01670
InstantCharacter:単一の画像から一貫性のある文字を生成するオープンソースツール 综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图... 最新AI工具# AI图像风格控制# AI开源项目 3周前01870