2026年6月12日AgentsMonitoringMCP

Hades恶意软件把AI安全护栏变成了隐身衣

Socket Security发现了一种真正新颖的恶意软件玩法:在代码里嵌入生物武器和核武器相关的文本。不是要造什么东西——这些字符串存在的唯一目的,是当LLM驱动的安全扫描器读到这个文件时,模型的安全训练被触发,模型拒绝继续分析,扫描中断,载荷永远不会被检查。一个精心设计出来的漏报。

这个被命名为Hades的攻击活动不是玩具。新变种用.pth加载器和原生扩展启动基于Bun的JavaScript窃取器,包一装上就抓GCP、Azure和CI/CD密钥。目标人群也很有针对性:生物信息学开发者和MCP开发者——恰好是机器里装满agent凭证的那群人。这事今天在Hacker News拿了223分。

真正让它成为本周最重要安全新闻的,是攻击方向的反转。我们之前报道过的这类攻击——Miasma的投毒仓库、POISE的技能注入、Bunq的一分钱转账——全都是通过输入攻击agent。Hades攻击的是模型自己的安全层。实验室当作保护机制训练进去的拒绝行为,成了攻击者的隐身衣。拒绝调得越狠,留给摸清触发词的人的盲区就越大。

时间点几乎讽刺:Fable 5把生物和网络安全防护当头条功能发布才几天,攻击者就演示了这些触发类别本身就是绝佳的伪装。扫描器厂商现在需要的是能直视违禁内容还继续分析的模型——而这恰恰是面向消费者的安全调优所禁止的。防御用AI和消费用AI,从今天起不再是同一个模型。

报道:https://www.tomshardware.com/tech-industry/cyber-security/hades-malware-campaign-now-tricks-ai-bots-by-injecting-text-about-biological-and-nuclear-weapons-failsafe-mechanisms-triggered-by-prompts-for-weapon-creation-stop-scans-before-payload-is-seen —— HN讨论:https://news.ycombinator.com/item?id=48495928
← 上一篇
MaxProof:一群证明打败了IMO金牌选手
下一篇 →
EvoArena:agent考试满分,然后世界变了
← 返回所有文章

评论

加载中...
>_