T-MAP:针对 MCP 生态的 LLM Agent 红队测试框架
T-MAP(Trajectory-aware MAP)是 KAIST 推出的新研究框架,专门针对快速增长的 MCP(模型上下文协议)生态中 LLM Agent 的安全漏洞进行红队测试。该论文在 HuggingFace Daily Papers 获得 29 次点赞。
此前的红队测试主要关注从 LLM 中诱导有害文本输出,而 T-MAP 解决的是通过多步工具执行才会暴露的 Agent 特有漏洞。它利用执行轨迹来引导对抗性提示的发现,这些提示能绕过安全防护并通过实际的工具交互实现有害目标。
该方法维护一个跨越风险类别和攻击风格的多维档案库,使用四步迭代循环:交叉诊断从过去的提示中提取成功因素和失败原因,结合学习到的工具调用图(TCG),指导新攻击提示的变异。
在多种 MCP 环境中的实证评估表明,T-MAP 在攻击实现率上显著优于基线方法,并且对 GPT-5.2、Gemini-3-Pro 和 Qwen3.5 等前沿模型仍然有效。这在 RSAC 2026 大会期间尤为及时,因为 Agent 安全已成为行业首要议题。
https://arxiv.org/abs/2603.22341
https://github.com/pwnhyo/T-MAP
← 返回所有文章
此前的红队测试主要关注从 LLM 中诱导有害文本输出,而 T-MAP 解决的是通过多步工具执行才会暴露的 Agent 特有漏洞。它利用执行轨迹来引导对抗性提示的发现,这些提示能绕过安全防护并通过实际的工具交互实现有害目标。
该方法维护一个跨越风险类别和攻击风格的多维档案库,使用四步迭代循环:交叉诊断从过去的提示中提取成功因素和失败原因,结合学习到的工具调用图(TCG),指导新攻击提示的变异。
在多种 MCP 环境中的实证评估表明,T-MAP 在攻击实现率上显著优于基线方法,并且对 GPT-5.2、Gemini-3-Pro 和 Qwen3.5 等前沿模型仍然有效。这在 RSAC 2026 大会期间尤为及时,因为 Agent 安全已成为行业首要议题。
https://arxiv.org/abs/2603.22341
https://github.com/pwnhyo/T-MAP
评论