Skip to content

AI Agent

ai 是 Aimaxbot 注入到脚本运行环境中的全局对象,用于让 AI 根据自然语言目标操作手机。

脚本中直接使用全局 ai 对象,无需 import


Agent API

ai.agent(goal, maxSteps)

让 AI 根据当前屏幕状态循环观察、决策和执行,直到完成、失败、停止或达到最大步数。

参数类型默认值说明
goalstring-要完成的自然语言目标
maxStepsnumber12最大执行步数,范围 130
javascript
let result = ai.agent("打开设置并进入 Wi-Fi 页面", 8);
log(result);

返回值是 JSON 字符串:

json
{
  "status": "completed",
  "result": "已进入 Wi-Fi 页面"
}

状态值:

状态说明
completed任务完成
stopped任务被停止
failed模型返回错误或执行失败
max_steps_reached达到最大步数仍未完成

别名:

javascript
ai.run(goal, maxSteps);
ai.task(goal, maxSteps);

ai.do(instruction)

执行一个短指令,内部最多执行 1 步 Agent 动作,适合简单操作。

javascript
let result = ai.do("返回桌面");
log(result);

ai.doAction(instruction)ai.do(instruction) 的别名。

ai.stopAgent()

请求停止当前 Agent。

javascript
ai.stopAgent();

Action 能力总览

开发者通常只需要调用 ai.agent()ai.do(),不需要手写 action。下面的表用于了解 Agent 当前能调用哪些能力,以及这些能力依赖无障碍还是 HID。

Action能力来源说明
click / tap无障碍优先,HID 兜底点击节点或坐标
long_press / long_click无障碍优先,HID 兜底长按节点或坐标
swipe无障碍优先,HID 兜底坐标滑动
scroll / scroll_up / scroll_down无障碍优先,HID 兜底滚动页面或可滚动节点
text_input / set_text无障碍优先,HID 兜底输入文本
global_action无障碍,部分 HID 兜底back / home / recents 可 HID 兜底;notifications / quick_settings 仅无障碍
hidHID直接执行 HID 点击、滑动、输入、返回、Home、按键
intent系统能力启动应用、Activity、网页或设置页
screenshot / screen_capture系统能力截图保存
download系统能力使用 DownloadManager 下载文件
http_request网络能力发起 HTTP 请求
camera系统能力打开系统相机拍照或录像
screen_record系统能力录屏开始、停止、状态查询
audio_record系统能力录音开始、停止、状态查询
volume系统能力音量设置、增减、静音、查询
wake_screen系统能力保持屏幕唤醒
clipboard系统能力读写剪贴板
dpmDevice Policy Manager锁屏、设备管控、权限、限制等企业设备能力
wait通用等待一段时间
finish通用标记任务完成
error通用标记任务无法继续

能力分类

无障碍支持

无障碍适合读取控件树、定位节点、点击控件、输入文本和执行系统全局动作。

Action说明
click / tap优先点击 node_id 对应控件,失败后可按坐标点击
long_press / long_click优先长按控件,失败后可按坐标长按
swipe坐标滑动
scroll / scroll_up / scroll_down滚动指定节点或页面中的可滚动节点
text_input / set_text优先 SET_TEXT,失败后尝试粘贴
global_action支持 backhomerecentsnotificationsquick_settings

HID 支持

HID 适合在无障碍节点不可用、WebView/游戏/图片区域较多、或需要模拟更接近真实触控时使用。

Action说明
click / tap无障碍失败后可用 HID 点击坐标
long_press / long_click无障碍失败后可用 HID 长按坐标
swipe无障碍失败后可用 HID 滑动
scroll / scroll_up / scroll_down无障碍失败后可用 HID 滑动模拟滚动
text_input / set_text无障碍输入失败后可用 HID 文本输入
global_actionbackhomerecents 支持 HID 兜底
hid直接调用 HID 能力:点击、滑动、输入、返回、Home、常用按键

通用能力

这些能力不依赖无障碍或 HID,但可能需要系统权限、屏幕捕获授权、网络权限或 Device Owner。

Action说明
intent打开应用、Activity、网页、设置页
screenshot / screen_capture截图
download下载文件
http_requestHTTP 请求
camera打开系统相机
screen_record录屏
audio_record录音
volume音量控制
wake_screen保持屏幕唤醒
clipboard剪贴板
dpm设备管理能力
wait等待
finish完成
error失败

示例

让 AI 完成一个页面操作

javascript
let result = ai.agent("打开浏览器,搜索 Aimaxbot 官网", 10);
log(result);

与普通脚本混合使用

javascript
app.launchPackage("com.android.chrome");
sleep(2000);

let result = ai.agent("在当前页面搜索 Aimaxbot 官网", 8);
log(result);

简单动作

javascript
ai.do("返回上一页");
ai.do("点击屏幕上的确认按钮");