课程 ID: 19190
描述:
话题概述:
在 GUI 自动化(移动端、Web 端)领域,大模型驱动的 Agent 虽展现出强大的泛化能力,但在处理“长链路、跨场景、多断言”的复杂任务时,面临严重的成功率“天花板”。
本项目通过构建一套分层多智能体架构(Multi-Agent),将 GUI Agent 的开发从简单的“提示词工程”进化为系统性的“上下文工程(Context
Engineering)”,在复杂的业务逻辑中实现了稳定、高精度的自动化执行。
演讲题纲:
话题亮点:
* 分层隔离架构:以智能体边界划定上下文边界,物理阻断历史噪声,确保决策环境“高纯度”。
* 动作空间裁剪 (Action Mask):JIT动态装配动作空间,仅暴露当前步骤所需的 20% 动作,大幅提升决策精度。
* 精准记忆流转:通过“宏观进度摘要 + 微观显式记忆”双层机制,确保长任务关键变量(如订单号、验证码)跨 Agent 零丢失。
* 动态执行干预:引入 Recovery Agent 具备运行时修改计划(插入子任务)的能力,实现架构级自愈。