LLManager:智能自动化流程审批与人类审核结合的管理工具
综合介绍 LLManager 是一个开源的智能审批管理工具,基于 LangChain 的 LangGraph 框架开发,专注于自动化处理审批请求,同时结合人类审核优化决策。它通过语义搜索、少样本学习和...
OpenAI.fm:展示OpenAI语音API的交互式演示工具
综合介绍 openai-fm 是一个开源项目,托管在 GitHub 上,专门用于展示 OpenAI 文本转语音(Text-to-Speech, TTS)API 的功能。这个项目通过一个交互式网页应用...
Fellou:自动化执行任务的原生AI浏览器
综合介绍 Fellou是一款由Fellou AI公司推出的全球首个人工智能行动型浏览器。它不仅具备传统浏览器的网页浏览功能,还通过AI技术实现任务自动化和深度信息搜索。Fellou的核心是“深度行动...
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具
综合介绍 Find My Kids 是一个开源项目,托管在 GitHub 上,由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API...
DocAgent:自动生成Python代码文档的智能工具
综合介绍 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析,自动为 Python 代码库生成高质量、上下文感知的文档注释(d...
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)
综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...
解读 Coze Space:字节跳动布局 AI Agent,瞄准“零门槛”办公助手
字节跳动入局:Coze Space 能否定义 AI Agent 的协同办公新范式? 近期,字节跳动旗下 AI Agent 开发平台 Coze 悄然启动了一项名为 Coze Space (spa...
Google 发布 Gemma 3 QAT 模型:让顶尖 AI 模型走进消费级 GPU
继上月推出新一代开放模型 Gemma 3 后,Google 近日再次拓展其模型生态,发布了基于量化感知训练 (Quantization-Aware Training, QAT) 优化的新版本。 Gem...
OpenUtau:免费的开源歌声合成编辑工具
综合介绍 OpenUtau 是一个免费的开源歌声合成编辑平台,旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者,解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Wind...
PostRoast:优化社交媒体内容的AI分析工具
综合介绍 PostRoast 是一个利用人工智能帮助用户优化社交媒体内容的在线工具,主要针对 X 平台(原 Twitter)的帖子分析。用户可以上传帖子内容,PostRoast 会通过 AI 算法分析...