Nanobrowser: Multi-Intelligence Plugin for Task Automation in Browsers综合介绍 Nanobrowser 是一个开源的Chrome浏览器扩展,旨在通过AI驱动的多代理系统实现网页任务的自动化。它是一个免费替代OpenAI Operator的工具,用户只需提供自己的LLM...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence3mos ago05790
Convergence: an AI assistant that automates repetitive tasks in an agent browser综合介绍 Convergence 是一家致力于利用机器学习技术帮助人们重新掌控时间的公司。通过开发大型元学习模型(LMLMs),Convergence的AI代理(浏览器代理)能够在实时使用中获取新技能...Latest AI tools# Desktop Automation Intelligence3mos ago07710
Proxy Lite: 3B Parametric Visual Model-Driven Web Automation Tool综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具,作为 Proxy 的迷你版,采用开放权重设计。它基于 3B参数的视觉语言模型(VLM),能够自...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence3mos ago07640
Rabbit Android Agent: voice-controlled intelligence for Android applications (not open)综合介绍 Rabbit Android Agent 是由 Rabbit 公司开发的一款创新 AI 智能体,旨在通过语音和文字指令,帮助用户在安卓设备上完成单步或多步任务。该技术基于 Rabbit 的 ...Latest AI tools# Desktop Automation Intelligence3mos ago05690
mac assistant: AI intelligence for macOS devices to automate desktop actions综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 ...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago05730
Open Operator: Performing Automation in Cloud Browsers with AI Intelligence综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago08810
MobileAgent: Multi-agent Collaboration Assistant for Mobile Devices综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago01.1K0
TankWork: an intelligent body that operates computers via voice and text and provides real-time voice feedback综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago08190
UI-TARS Desktop: Desktop Intelligentsia Application for Controlling Computers Using Natural Language综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago01.3K0
Shortest: an AI automated testing tool that uses natural language for end-to-end testing综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago08640
Midscene.js: Open Source Plugin for Automated Browser Testing Driven by AI综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具,能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本,简化了UI测...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago01.1K0
Stagehand: A Framework for Natural Language Implementation of Browser Automation Operations综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01K0
AutoMouser: Generating Browser Automation Code to Convert Mouse Actions to Selenium Python Scripts via AI综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago09570
E2B Open Computer Use: Running an AI operating system safely in the E2B sandbox综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01K0
Project Mariner: browser automation, a research prototype exploring the future of human-computer interaction (unpublished)综合介绍 Project Mariner 是 Google DeepMind 推出的一个研究原型,旨在探索未来的人机交互方式。该项目利用 Gemini 2.0 强大的多模态理解和推理能力,通过浏览器自...Latest AI tools# Desktop Automation Intelligence5mos ago01.1K0
NeoAI: Open source project that lets AI take over remote operation of computers and control them using natural language综合介绍 NeoAI是一款创新的开源AI助手工具,它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码,用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01.1K0
GLM-PC (Smart Spectrum Bull) officially released for internal download, the real AI that can control the computerGLM-PC(牛牛)简介 GLM-PC 是基于 CogAgent 模型的桌面应用,能通过自然语言指令快速执行复杂任务。它具备任务规划和界面理解能力,可根据用户指令自主完成各种计算机操作。 使用注意...Latest AI tools# Desktop Automation Intelligence5mos ago01.2K0
Agent.exe: Let AI control your computer directly, an open source implementation of Claude's control computer综合介绍 Agent.exe 是一个开源的 Electron 应用程序,利用 Anthropic 的 Claude 3.5 Sonnet API,让用户可以通过 AI 直接控制本地计算机。该项目由 K...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01.6K0
AppAgent: automated smartphone operation using multimodal intelligences综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01.1K0