Convergence: an AI assistant that automates repetitive tasks in an agent browser综合介绍 Convergence 是一家致力于利用机器学习技术帮助人们重新掌控时间的公司。通过开发大型元学习模型(LMLMs),Convergence的AI代理(浏览器代理)能够在实时使用中获取新技能...Latest AI tools# Desktop Automation Intelligence3mos ago07630
mac assistant: AI intelligence for macOS devices to automate desktop actions综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 ...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago05620
Open Operator: Performing Automation in Cloud Browsers with AI Intelligence综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago08730
MobileAgent: Multi-agent Collaboration Assistant for Mobile Devices综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago01.1K0
TankWork: an intelligent body that operates computers via voice and text and provides real-time voice feedback综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago08130
UI-TARS Desktop: Desktop Intelligentsia Application for Controlling Computers Using Natural Language综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago01.3K0
Shortest: an AI automated testing tool that uses natural language for end-to-end testing综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago08590
Midscene.js: Open Source Plugin for Automated Browser Testing Driven by AI综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具,能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本,简化了UI测...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence4mos ago01.1K0
Stagehand: A Framework for Natural Language Implementation of Browser Automation Operations综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago09800
Eko: Natural Language Builds Intelligent Body Workflows for Desktop and Browser Automation综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...Latest AI tools# AI Java Open Source Projecct# Low-code workflow# Intelligent Body Application3mos ago01K0
AutoMouser: Generating Browser Automation Code to Convert Mouse Actions to Selenium Python Scripts via AI综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago09540
Browser Use Web UI: an open source framework for running AI intelligences to browse the web, allowing AI to automatically manipulate web pages综合介绍 Browser Use Web UI是一个创新的开源项目,专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上,通过Gradio构建了一个用...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence2mos ago01.8K0
E2B Open Computer Use: Running an AI operating system safely in the E2B sandbox综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago09940
NeoAI: Open source project that lets AI take over remote operation of computers and control them using natural language综合介绍 NeoAI是一款创新的开源AI助手工具,它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码,用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01.1K0
CogAgent: Smart Spectrum's open source intelligent visual language model for automating graphical interfaces综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01K0
ClickClickClickClick: Enable Any LLM to Automate Android and PC Operations综合介绍 ClickClickClick是一个由BandarLabs开发的框架,旨在通过使用任何本地或远程的大型语言模型(LLM)实现安卓和电脑的自动化操作。该项目目前处于高度实验阶段,支持多种模型如...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago09320
Browser-Use: Building Intelligent Web Automation Tools for AI Intelligents to Easily Operate Browsers综合介绍 Browser-Use是一个创新的开源网页自动化工具,专门设计用于让语言模型(LLM)能够自然地与网站进行交互。它提供了一个强大而灵活的框架,支持多种主流语言模型,包括GPT-4、Claud...Latest AI tools# AI Java Open Source Projecct# Desktop Automation Intelligence5mos ago01.8K0
Project Mariner: browser automation, a research prototype exploring the future of human-computer interaction (unpublished)综合介绍 Project Mariner 是 Google DeepMind 推出的一个研究原型,旨在探索未来的人机交互方式。该项目利用 Gemini 2.0 强大的多模态理解和推理能力,通过浏览器自...Latest AI tools# Desktop Automation Intelligence5mos ago01.1K0
Dia Browser: provides an intelligent browsing experience with integrated AI tools to automate tasks in the browser (not yet live)综合介绍 Dia Browser是由The Browser Company开发的一款全新智能浏览器,旨在通过集成先进的AI工具,为用户提供更高效的浏览体验。该浏览器预计于2025年初正式发布,主要特点...Latest AI tools# Desktop Automation Intelligence5mos ago01.1K0