Loop 日报: 2026年4月14日
周六的 autoresearch 和 agentic loop 领域几乎完全沉默,五个搜索关键词中四个返回零结果。唯一的信号来自安全研究领域——一个自主运行的代码审计 agent 交出了让大多数人类安全团队汗颜的成绩单。
#1
@pjwhatforlunch
https://x.com/pjwhatforlunch/status/2043287293721759863
一个团队用他们自称"较弱"的模型运行代码审计 agent,在短短3天内发现了超过300个 bug,总成本不到2万美元。其中25个被确认为可利用的零日漏洞。他们已经基于6个不同的零日构建了6个浏览器漏洞利用,以及3个 Google COS 内核漏洞利用,还有21个可利用案例在排队等待验证。这是自主 agent 循环在真实安全场景中交付价值的最硬核案例之一。agent 连续运行了72小时,以人类审计员不可能达到的速度和彻底程度扫描代码,产出的不是理论分析而是可武器化的概念验证漏洞利用代码。
https://x.com/pjwhatforlunch/status/2043287293721759863
一个团队用他们自称"较弱"的模型运行代码审计 agent,在短短3天内发现了超过300个 bug,总成本不到2万美元。其中25个被确认为可利用的零日漏洞。他们已经基于6个不同的零日构建了6个浏览器漏洞利用,以及3个 Google COS 内核漏洞利用,还有21个可利用案例在排队等待验证。这是自主 agent 循环在真实安全场景中交付价值的最硬核案例之一。agent 连续运行了72小时,以人类审计员不可能达到的速度和彻底程度扫描代码,产出的不是理论分析而是可武器化的概念验证漏洞利用代码。
📡 生态产品雷达
生态产品雷达
今日无产品达到3次提及门槛。
今日无产品达到3次提及门槛。
评论