
AppAgent是一个多模态智能体,由腾讯和德州大学达拉斯分校的研究团队合作开发。它是一种基于大型语言模型的多模态手机用户代理框架,可模拟人类在智能手机上的操作。
AppAgent可以通过自主学习和模仿人类的点击和滑动手势,在手机上执行复杂的任务,与应用程序进行交互。它通过引入一种基于大型语言模型的多模态智能代理(Agent)框架,赋予了智能体操作智能手机应用的能力。AppAgent的操作方式是通过直接识别当前手机的界面和用户指令,直接操作手机界面,能像真实用户一样操作手机。
AppAgent的技术原理是什么?
AppAgent的技术原理是基于大型语言模型的多模态智能代理(Agent)框架,赋予了智能体操作智能手机应用的能力。AppAgent的学习方法是通过自主探索或观察人类演示来学习如何使用新的应用程序,生成一个知识库,以便代理在不同应用程序之间执行复杂任务。
哪些应用程序可以与AppAgent进行交互?
AppAgent可以与多种应用程序进行交互,包括社交媒体、电子邮件、地图、购物和复杂的图像编辑工具等. 为了展示我们的代理的实用性,我们在10个不同的应用程序中进行了50项任务的广泛测试。请注意,AppAgent的学习方法是通过自主探索或观察人类演示来学习如何使用新的应用程序,生成一个知识库,以便代理在不同应用程序之间执行复杂任务。因此,AppAgent可以与任何应用程序进行交互,只要它们在代理的知识库中。
开源地址:https://github.com/mnotgod96/AppAgent
论文地址: https://arxiv.org/abs/2312.13771
项目地址:https://appagent-official.github.io/
数据统计
相关导航

知犀AI是知犀思维导图和AI技...

UPDF
UPDF是一款新一代AI智能PDF编辑器,具有PDF文档编辑、注释、格式转换、OCR、翻译、AI对话等功能。为用户提供PDF编辑功能,随时修改PDF文件,此外,UPDF还有PDF数字签名,密文,压缩PDF,合并PDF,PDF分页等功能;AI助手可帮助用户快速总结PDF,翻译PDF,解释PDF,或直接与PDF AI对话,让PDF编辑更高效。

亿图图示AI
亿图图示AI是什么 亿图图示A...

Flot AI
Flot.ai 是一款集成式的人工智能写作助手,它使用 GPT-4 模型并支持超过 200 种语言。这个工具可以帮助用户在各种应用或网站上获得 AI 的帮助,从而提高工作效率和效率。

博思AIPPT
博思AIPPT是什么 博思AIPPT...

超级公式
超级公式是一款高效的AI公式文档识别工具。它主要用于识别PDF文件和图片中的数学公式,并能将这些公式转换成多种格式,如LaTeX、Word、TXT等。这款软件特别适合学生、教育工作者以及需要在论文中输入大量公式的研究人员使用。

雷鸟365协作
雷鸟365协作是一个云端Office工具,专注于提供在线协作Excel表格功能。它允许多人同时在线编辑表格,支持表格、工作簿和单元格的精细权限设置,如编辑、查看和隐藏等。此外,雷鸟365还提供了AI问答和AI绘图等功能,以及对文档、演示文稿和表单的全面支持。

Noty AI
Noty.ai是一款先进的AI会议助手,旨在通过自动转录和生成会议纪要来提高生产力。它能够将对话转化为可执行的任务,具有实时转录、智能总结、自动任务生成、高效组织等功能,适用于企业会议、远程协作和教育培训。同时支持87种语言,转录准确率高达95%,与主流协作工具无缝集成,显著提升工作效率。
暂无评论...