OmniSVG: a partir de texto e imagens para gerar gráficos vetoriais SVG projeto de código aberto
综合介绍 OmniSVG 是一个开源项目,专注于通过多模态模型生成高质量矢量图形(SVG)。它利用预训练的视觉-语言模型,支持从文本描述或图像输入生成 SVG,涵盖简单图标到复杂动漫角色的多种场景。项...
Napkins.dev: upload de wireframes para gerar código de front-end com base no Llama4
综合介绍 Napkins.dev 是一个免费的开源项目,核心功能是让用户上传界面截图或线框图,自动生成可运行的前端代码。用户只需提供一张设计图,工具会通过 Llama 4 模型(由 Together ...
EmemeAI: plataforma interativa para criação e exportação de personagens virtuais de IA em 3D
综合介绍 EmemeAI是一个帮助用户创建3D AI角色的平台。你可以上传VRM格式的3D模型,设置角色的性格,生成能聊天、自动动起来的虚拟角色。这些角色不仅能与你对话,还能根据语境生成表情和动作。E...
Agent-Wiz: analisando fluxos de trabalho e riscos de segurança da AI Intelligentsia
综合介绍 Agent-Wiz 是一个开源的Python命令行工具,专为开发者、研究人员和安全团队设计。它能从LangGraph、CrewAI、AutoGen等主流AI智能体框架中提取复杂的工作流程,生...
Orion: estrutura de planejamento e inferência de condução autônoma de ponta a ponta de código aberto da Xiaomi
综合介绍 Orion 是小米实验室开发的开源项目,专注于端到端(E2E)自动驾驶技术。它通过视觉语言模型(VLM)和生成式规划器,解决传统自动驾驶方法在复杂场景中因果推理不足的问题。Orion 整合长...
ReCamMaster: ferramenta de renderização para gerar vídeos com várias visualizações a partir de um único vídeo
综合介绍 ReCamMaster 是一个开源视频处理工具,核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹,重新渲染视频,获得不同角度的动态画面。它由浙江大学、快手科技等团队开发,基于文本到...
BrowseComp: OpenAI lança novo benchmark para avaliar a capacidade de recuperação de informações das redes de IA
Recentemente, a OpenAI lançou um novo teste de benchmark chamado BrowseComp, projetado para avaliar a capacidade dos agentes de IA de navegar na Internet. O benchmark consiste em 1.266 perguntas que abrangem uma ampla gama de domínios, desde a descoberta científica até a cultura pop, e exige que o agente...
WiseBIM AI: conversão rápida de desenhos arquitetônicos 2D em modelos BIM 3D
综合介绍 WiseBIM AI 是一款基于人工智能的Revit插件,专注于将2D建筑图纸快速转化为3D BIM模型。它由法国公司WiseBIM SAS开发,能自动识别图纸中的墙体、门窗、楼板等元素,生...
SimplAI: uma plataforma para que as empresas criem rapidamente aplicativos inteligentes de IA
综合介绍 SimplAI 是一个专为企业设计的平台,帮助用户快速构建、部署和管理安全的AI代理及自动化工作流程。它提供了一个简单易用的工具——SimplAI Studio,让团队无需复杂编程就能开发A...
Tarsier: um modelo de compreensão de vídeo de código aberto para gerar descrições de vídeo de alta qualidade
综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...