AppAgent:利用多模态智能体自动操作智能手机

AppAgent : utilisation automatisée d'un smartphone à l'aide d'intelligences multimodales

Introduction complète AppAgent est un agent multimodal basé sur le modèle du grand langage (LLM) conçu pour manipuler les applications de smartphones. Le cadre imite les interactions humaines telles que les taps et les swipes à travers un espace de manipulation simplifié, éliminant ainsi le besoin d'un accès au système back-end et étendant son utilisation à travers différentes applications...
il y a 5 mois
01.2K0