AI Agent 执行基础设施：主流 Agent 的 Sandbox 演进实践

课程 ID: 19297

描述:
话题概述: 随着 AI 编程工具从“代码补全”逐步演进到“自主执行任务”，Cursor、Claude Code、OpenClaw、Cowork 等 Agent 应用开始具备读取代码库、修改文件、执行命令、安装依赖、访问网络、调用浏览器等能力。这带来了新的工程挑战：LLM 不再只是生成文本，而是被赋予了真实的系统执行权。如果执行环境缺少边界，Agent 可能误删文件、泄露密钥、访问不该访问的网络资源，或者在安装依赖和运行脚本时引入供应链风险。因此，项目关注的核心问题是：当 AI Agent 需要执行代码和系统命令时，如何设计一个可隔离、可观测、可回收、可控制网络访问的 Sandbox 执行环境。通过对 Cursor、Claude Code、OpenClaw、Cowork 以及 OpenSandbox、E2B、CubeSandbox 等方案的分析，总结 AI Agent 执行环境从本机执行、容器隔离到基础设施化 Sandbox 的演进路径。演讲题纲: 话题亮点：本分享将 AI Agent 执行体系拆分为两层进行分析：第一层是 Agent 应用层，包括 Cursor、Claude Code、Cowork、OpenClaw 等，它们负责任务理解、代码修改、工具调用和执行编排；第二层是 Sandbox 执行层，负责限制 Agent 的文件系统、进程、网络、密钥和资源访问边界。在执行层上，进一步总结了几类常见 Sandbox 形态：本机直接执行、OS 级权限控制、容器级隔离、MicroVM / VM 级隔离，以及 Sandbox as a Service。通过这种分层，可以避免把“Agent 工具”和“Sandbox 能力”混为一谈。项目重点分析了几个关键技术点：一是如何为每个任务或会话提供独立 workspace；二是如何限制 Agent 对宿主机文件、网络和密钥的访问；三是如何通过 Docker、Dev Container、远程执行环境或 OpenSandbox 这类基础设施方案降低执行风险；四是如何在安全隔离和开发体验之间取得平衡。最终形成了一套适用于企业场景的 Agent 执行环境设计思路：上层 Agent 负责完成任务，下层 Sandbox 负责提供受控执行边界，并通过生命周期管理、网络策略、资源限制、日志审计和环境回收来提升整体安全性和可治理性。