2026年6月13日Agents Monitoring MCP

Hades恶意软件把AI安全护栏变成了隐身衣

Socket Security发现了一种真正新颖的恶意软件玩法：在代码里嵌入生物武器和核武器相关的文本。不是要造什么东西——这些字符串存在的唯一目的，是当LLM驱动的安全扫描器读到这个文件时，模型的安全训练被触发，模型拒绝继续分析，扫描中断，载荷永远不会被检查。一个精心设计出来的漏报。

这个被命名为Hades的攻击活动不是玩具。新变种用.pth加载器和原生扩展启动基于Bun的JavaScript窃取器，包一装上就抓GCP、Azure和CI/CD密钥。目标人群也很有针对性：生物信息学开发者和MCP开发者——恰好是机器里装满agent凭证的那群人。这事今天在Hacker News拿了223分。

真正让它成为本周最重要安全新闻的，是攻击方向的反转。我们之前报道过的这类攻击——Miasma的投毒仓库、POISE的技能注入、Bunq的一分钱转账——全都是通过输入攻击agent。Hades攻击的是模型自己的安全层。实验室当作保护机制训练进去的拒绝行为，成了攻击者的隐身衣。拒绝调得越狠，留给摸清触发词的人的盲区就越大。

时间点几乎讽刺：Fable 5把生物和网络安全防护当头条功能发布才几天，攻击者就演示了这些触发类别本身就是绝佳的伪装。扫描器厂商现在需要的是能直视违禁内容还继续分析的模型——而这恰恰是面向消费者的安全调优所禁止的。防御用AI和消费用AI，从今天起不再是同一个模型。

报道：https://www.tomshardware.com/tech-industry/cyber-security/hades-malware-campaign-now-tricks-ai-bots-by-injecting-text-about-biological-and-nuclear-weapons-failsafe-mechanisms-triggered-by-prompts-for-weapon-creation-stop-scans-before-payload-is-seen —— HN讨论：https://news.ycombinator.com/item?id=48495928

← 上一篇

MaxProof：一群证明打败了IMO金牌选手

EvoArena：agent考试满分，然后世界变了

← 返回所有文章

加载中...

Hades恶意软件把AI安全护栏变成了隐身衣

相关文章

评论