OmniSVG:从文本和图像生成SVG矢量图形的开源项目
综合介绍 OmniSVG 是一个开源项目,专注于通过多模态模型生成高质量矢量图形(SVG)。它利用预训练的视觉-语言模型,支持从文本描述或图像输入生成 SVG,涵盖简单图标到复杂动漫角色的多种场景。项...
Napkins.dev:基于Llama4上传线框图生成前端代码
综合介绍 Napkins.dev 是一个免费的开源项目,核心功能是让用户上传界面截图或线框图,自动生成可运行的前端代码。用户只需提供一张设计图,工具会通过 Llama 4 模型(由 Together ...
EmemeAI:创建并导出3D虚拟AI角色的互动平台
综合介绍 EmemeAI是一个帮助用户创建3D AI角色的平台。你可以上传VRM格式的3D模型,设置角色的性格,生成能聊天、自动动起来的虚拟角色。这些角色不仅能与你对话,还能根据语境生成表情和动作。E...
Agent-Wiz:分析AI智能体工作流程和安全风险
综合介绍 Agent-Wiz 是一个开源的Python命令行工具,专为开发者、研究人员和安全团队设计。它能从LangGraph、CrewAI、AutoGen等主流AI智能体框架中提取复杂的工作流程,生...
Orion:小米开源的端到端自动驾驶推理与规划框架
综合介绍 Orion 是小米实验室开发的开源项目,专注于端到端(E2E)自动驾驶技术。它通过视觉语言模型(VLM)和生成式规划器,解决传统自动驾驶方法在复杂场景中因果推理不足的问题。Orion 整合长...
ReCamMaster:从单一视频生成多视角视频的渲染工具
综合介绍 ReCamMaster 是一个开源视频处理工具,核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹,重新渲染视频,获得不同角度的动态画面。它由浙江大学、快手科技等团队开发,基于文本到...
BrowseComp:OpenAI 推出评估AI网络信息检索能力的新基准
近日,OpenAI 发布了一项名为 BrowseComp 的新基准测试,旨在评估人工智能代理在互联网浏览方面的能力。这一基准测试由 1,266 个问题组成,涵盖了从科学发现到流行文化等多个领域,要求代...
WiseBIM AI:2D建筑图纸快速转化为3D BIM模型
综合介绍 WiseBIM AI 是一款基于人工智能的Revit插件,专注于将2D建筑图纸快速转化为3D BIM模型。它由法国公司WiseBIM SAS开发,能自动识别图纸中的墙体、门窗、楼板等元素,生...
SimplAI:企业快速构建智能AI应用的平台
综合介绍 SimplAI 是一个专为企业设计的平台,帮助用户快速构建、部署和管理安全的AI代理及自动化工作流程。它提供了一个简单易用的工具——SimplAI Studio,让团队无需复杂编程就能开发A...
Tarsier:生成高质量视频描述的开源视频理解模型
综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...