MLX-Audio:基于 Apple MLX 框架的文本转语音工具综合介绍 MLX-Audio 是一个基于 Apple MLX 框架开发的开源工具,专注于文本转语音(TTS)和语音转语音(STS)功能。它充分利用 Apple Silicon(如 M 系列芯片)的强大...最新AI工具# AI开源项目# AI文本转语音4个月前0680
Spark-TTS:生成自然语音的文本转语音工具综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语...最新AI工具# AI开源项目# AI文本转语音# AI语音克隆3个月前0839
Agent Leaderboard:AI Agent 性能评估排行榜综合介绍 Agent Leaderboard 是由 Galileo AI 在 Hugging Face 平台上推出的一个专注于 AI 代理性能评估的在线工具。它通过综合多个权威数据集(如 BFCL、τ...最新AI工具# AI开放服务4个月前0719
Mahilo:连接不同AI智能体框架实时协作的集成平台综合介绍 Mahilo 是一个开源的多智能体集成平台,由开发者 Jayesh Sharma 在 GitHub 上发布,旨在帮助用户连接来自不同框架的 AI 智能体,支持实时通信、人机交互及智能协作。该...最新AI工具# AI开源项目# 智能体开发框架4个月前0577
OPR:智能修复泛黄、破损老旧照片的AI工具综合介绍 “Bringing Old Photos Back to Life”是微软研究团队开发的一个开源项目,专注于利用AI技术修复老旧照片。它基于深度学习方法,能够处理照片中的严重退化问题,如划痕...最新AI工具# AI图像放大与修复# AI开源项目4个月前0583
Prompt Optimizer:优化主流AI模型提示词的开源工具综合介绍 Prompt Optimizer 是一个专注于提示词优化的开源工具,由 linshenkx 在 GitHub 上开发。它能够帮助用户通过智能算法优化 AI 模型的提示词,从而提升生成内容的质...最新AI工具# AI开源项目# PROMPTS辅助工具4个月前0870
Humanify:借助AI快速解密和美化JavaScript代码的工具综合介绍 Humanify 是一个开源工具,托管于 GitHub,由开发者 Jesse Luoto 创建,旨在帮助程序员利用人工智能技术快速解密和美化混淆的 JavaScript 代码。它集成了 Ch...最新AI工具# AI开源项目4个月前0638
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具,旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行...最新AI工具# AI开源项目4个月前0600
HeyReal:无限制的AI角色聊天互动平台综合介绍 HeyReal 是一个创新的在线平台,专注于提供高度个性化和无限制的AI聊天体验。用户可以通过这个网站创建并与虚拟角色互动,这些角色可以根据用户的喜好进行深度定制,包括外观、性格和对话风格...最新AI工具# AI角色扮演4个月前0842
WhisperChain:实时语音转文字并优化口语化词语综合介绍 WhisperChain 是一个基于人工智能的开源项目,托管在 GitHub 上,由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字,并通过 AI 技术自动优化表达,去除冗...最新AI工具# AI开源项目# AI语音转文本4个月前0626
VideoGrain:文本提示对视频进行局部编辑的开源项目综合介绍 VideoGrain 是一个专注于多粒度视频编辑的开源项目,由 xAI 团队开发并在 GitHub 上托管。这个项目出自论文《VideoGrain: Modulating Space-Tim...最新AI工具# AI开源项目# AI音视频编辑4个月前0618
Mercury Coder:基于 Diffusion 的代码生成大模型综合介绍 Mercury Coder 是由 Inception Labs 推出的一款人工智能对话工具,专注于高效代码生成和超长上下文处理。它基于先进的扩散模型技术(diffusion technolo...最新AI工具# AI大模型原生对话工具4个月前0731
Mobius Diffusion:文本提示生成无缝循环视频综合介绍 Mobius Diffusion 是一个创新的在线工具,专注于通过文本输入生成无缝循环的视频内容。它基于预训练的视频扩散模型,无需用户自行训练或提供标注数据即可快速上手。网站的核心技术是通过...最新AI工具# AI开源项目# AI文本转视频4个月前0620
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架综合介绍 RuoYi AI 是一个基于 ruoyi-plus 框架开发的后端项目,专注于集成 AI 聊天和绘画功能。它完全开源免费,采用 Java17 和 SpringBoot 3.X 技术栈,后台管...最新AI工具# AI副业赚钱项目# AI开源项目4个月前0761
Vision Agent:解决多种视觉目标检测任务的视觉智能体综合介绍 Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,托管在 GitHub 上,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...最新AI工具# AI开源项目# 视觉目标检测4个月前0632
DeepSeek-R1-FP4:FP4优化版DeepSeek-R1推理速度25倍综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型,基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Opt...最新AI工具# AI开源项目4个月前0692
MyCoder:自动修复代码、生成测试用例的命令行AI工具综合介绍 MyCoder 是一个由 drivecore 团队开发并托管在 GitHub 上的开源项目,旨在通过命令行界面为开发者提供智能化的编程辅助。它基于 Anthropic 的 Claude AP...最新AI工具# AI开源项目# AI编程4个月前0622
Baichuan-Audio:支持实时语音交互的端到端音频模型综合介绍 Baichuan-Audio 是由百川智能(baichuan-inc)开发的一个开源项目,托管于 GitHub 上,专注于端到端的语音交互技术。该项目提供了一个完整的音频处理框架,能够将语音...最新AI工具# AI开源项目# 多模态实时互动产品4个月前0626
R1-Onevision:支持多模态推理的开源视觉语言模型综合介绍 R1-Onevision 是一个由 Fancy-MLLM 团队开发的开源多模态大语言模型,专注于视觉与语言的深度结合,能够处理图像、文本等多模态输入,并在视觉推理、图像理解、数学解题等领域表...最新AI工具# AI开源项目4个月前0674