改变战局！Cloudflare亲测Mythos，AI漏洞审计进入生产

【导读】Cloudflare将Mythos Preview 用于审查 50 多个自研代码仓库，观察 AI 如何发现漏洞、构造攻击链、生成可验证证明。前沿模型正在把安全研究从人工推向自动化。

Mythos进入真实代码审计场景

网络安全的攻防节奏，正在被前沿AI加速。

主角是 Anthropic 的 Mythos Preview。

Cloudflare 将 Mythos 用于检查 50 多个自研代码仓库，评估模型在漏洞发现中的实际表现。

真正值得警惕的，不只是模型能报告漏洞。

而是它开始像安全研究员一样，把多个漏洞原语组合成攻击链！

低危问题，能被组合成高危利用路径。

低危漏洞被组合成攻击链

Cloudflare 明确指出，真实的攻击很少只依赖单个漏洞。

攻击者常常会串联多个利用原语：从UAF，到任意读写，再到控制流劫持，最后借助 ROP 链获得系统控制能力。

过去，很多模型只能停留在「这里可能存在漏洞」的层面。

Mythos Preview 的变化在于，它会继续推理漏洞原语之间的组合关系。

它不仅能分析这些原语如何形成攻击链，还能进一步构造可运行的验证证明。

它不只生成文字报告。

它会编写触发疑似漏洞的代码，在沙盒中编译并运行。

如果程序行为不符合预期，它会读取失败结果，修正假设并再次尝试。

这就是安全研究中的关键分界线：

AI 正在从「发现疑点」走向「证明漏洞可被利用」。

Cloudflare 的原话很克制，但意思已经到了。

一个带 PoC 的发现，和一个「可能存在问题」的发现，完全不是同一种结果。

前者能直接进入修复决策，后者只是消耗人类时间。

而 Mythos Preview 的变化，正卡在这个关键点上。

安全护栏，仍然不稳定

更值得关注的是，模型的安全边界仍然不稳定。

Cloudflare 观察到：

Project Glasswing 中使用的 Mythos Preview 并不包含一般可用模型所具备的额外安全防护机制。

即便如此，它有时仍会自发拒绝某些请求。

问题在于，这种拒绝并不一致。

同一段代码，同一类研究任务，换一个上下文，模型可能从拒绝变成同意。

同义任务在不同运行中，也可能走向相反结果。

说明安全边界还不能作为稳定防线。

Cloudflare 判断：未来任何面向公众使用的网络安全前沿模型，都必须叠加额外安全防护。

否则，能力越强，风险越不受控。

50个漏洞任务并行运行

真正改变战局的，是 Cloudflare 没有把它当聊天机器人用。

他们很快发现，把一个通用的coding agent 接入仓库，让它笼统地「寻找漏洞」，远远不够。

一个agent面对 100000 行级代码仓库，可能只能有效覆盖十分之一百分点量级的攻击面。

当上下文窗口耗尽，早期发现的问题还可能在摘要压缩中丢失。

所以Cloudflare搭出一条 harness，把漏洞发现拆成几个阶段，把模型塞进流水线。

侦察阶段先读取仓库，生成架构文档、信任边界、入口点和攻击面。

狩猎阶段，每个任务只盯一个攻击类别和一个范围提示。

通常约 50 个漏洞搜索任务并行运行！

每个搜索任务还会派生多个探索subagent，在独立目录中编译并运行概念验证代码。

验证阶段则由另一个独立agent进行反向验证。

它使用不同提示词和不同模型，而且生成新的漏洞发现，只负责判断原始发现是否成立。

Cloudflare：让两个agent进行有意对抗，比让一个agent进行自我审查更有效。

后面还有补全、去重、追踪、反馈、报告。

其中追踪最关键。

它要判断共享库中的漏洞，是否真的能被外部攻击者控制的输入触达。

这一步把「这里有漏洞」变成了「这里有可达漏洞」。

安全研究，正在被拆解成一条多agent自动化流程。

而这套流程已经覆盖 Cloudflare 的运行时、边缘数据路径、协议栈、控制平面，以及依赖的开源项目。

两小时补丁，不是最终答案

Cloudflare 最后给安全团队提出了一个更现实的问题。

很多安全负责人现在盯着速度：扫描更快，补丁更快，把响应周期压缩。

不止一个安全团队，已经在按「CVE 发布到生产补丁 2 小时」的SLA运行。

但 Cloudflare 说，光更快不够。

如果回归测试需要一天。

那么 2 小时 SLA 的唯一实现方式，就是跳过测试。

跳过测试直接发布补丁，可能修复原始漏洞，却引入新的系统依赖问题。

Cloudflare 自己就吃过这个血亏：AI补丁修复了原始漏洞，却破坏了其他依赖关系。

更快的补丁，救不了你。

真正的防御，是即使漏洞存在，也要让攻击者更难触达。

要有挡在应用前面的防线，要让一个局部漏洞不能横向横向蔓延到整个系统。。

还要能把修复同时推到代码运行的每个节点。

最后，Cloudflare 承认，这项能力是双刃剑。

它能帮助他们发现自有代码中的漏洞。

但落到错误的人手里，也会加速针对互联网的攻击。

AI正在缩小整个攻防时间窗口。

大多数团队目前还没准备好。

参考资料: https://blog.cloudflare.com/cyber-frontier-models/

声明：本文来自玄月调查小组，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

改变战局！Cloudflare亲测Mythos，AI漏洞审计进入生产

Mythos进入真实代码审计场景

低危漏洞被组合成攻击链

安全护栏，仍然不稳定

50个漏洞任务并行运行

两小时补丁，不是最终答案

当Prompt变成SQL Payload：LLM数据库Agent的三层防线

当大模型学会逆向拆解EDR，终端安全的天平正在倾斜

Firefox一个月用Mythos发现500个漏洞？真相来了