记者| 肖潇

编辑| 王俊

欧洲央行(ECB)经常举办定期会议,但就一个问题临时开会的情况很少见。当地时间5月26日,欧洲央行紧急召开了一场网络安全会议,警告各大银行:最新大模型Mythos正在威胁金融系统,银行需要大幅加快安全漏洞的修复。

不只欧洲,自Mythos今年4月发布以来,全球监管层一直在忙着发出警报。先是美国财政部长和美联储主席紧急召开闭门会议,随后英国、日本、加拿大、德国等监管部门也开始把AI网络安全列入金融稳定议题。

Mythos被视为Anthropic Claude产品线迄今能力最强的模型,在发现和利用软件漏洞上的表现显著飞升。Anthropic警告其已经“发现潜藏了几十年的高危漏洞,包括所有主流操作系统和浏览器”,与此同时,“这种漏洞可能对经济、公共安全和国家安全造成严重后果”。

不少人把Mythos形容为网络安全领域的“奥本海默时刻”。出于安全考虑,Anthropic第一次限制模型公开,而是启动了名为玻璃之翼(Project Glasswing)的项目——仅向微软、苹果、摩根大通等12家美国巨头提供访问权,提早检测关键设施的漏洞,先把防火墙码高。

但这也让没有访问权的地区产生了新的焦虑。“欧洲银行无法使用Mythos模型,美国银行应该尽快与欧元区分享经验。”欧洲央行监管委员会高层在媒体采访中催促道。

发展和安全再次成为紧紧贴合的硬币两面:一面是猛涨的AI风险,另一面是越来越明显的技术差距,全球金融机构最先感受到压力。

不过,由于大多数人没法接触Mythos的真实情况,现在还不能确定网络安全到底会被如何颠覆。

英国人工智能安全研究所(AISI)认为,不能断言AI马上就会击垮互联网。但可以肯定的是,人们不能再把相关风险视为“几年后的问题”了,当下是一个关键防御窗口期。

01 有哪些警告?

4月7日,Mythos官宣问世当天,美国华盛顿突然召开了一场闭门会议,参会的有美国财政部长贝森特、美联储主席鲍威尔,以及来自花旗、摩根士丹利和高盛等大型金融机构的高管。

多家外媒随后披露,这场会议的议题便是评估Mythos对银行系统带来的冲击,以及金融机构需要启动内部大模型测试。

类似的紧急会议,在接下来两个月席卷全球政府高层:

4月12日,英国央行、英国金融市场行为监管局和国家网络安全中心临时召开圆桌会议,核查Mythos可能暴露的关键信息系统漏洞,要求各机构以“10倍紧迫性”采取行动加强网络防御。

4月17日,加拿大央行两次主持金融稳定会议,将Mythos等AI驱动的网络攻击列为重点议题。

4月末,日本财务大臣和日本三大银行会面,宣布成立联合专组来应对金融风险,并希望能在两周内获得Mythos的使用权。

新加坡网络安全局致函本国所有关键信息基础设施机构的高层,要求它们重新评估AI网络攻击对现有安全体系的影响。

多种态度透露了一个信号:AI网络攻击正在成为重要的金融风险。银行不仅因为资金集中而容易成为网络攻击的理想目标,也因为底层的交易系统、清算系统、客户数据库、身份验证模块,往往建立在庞大的第三方软件生态之上,其中不少核心架构已经运行了数十年。

“如果某家大型软件供应商发布了一个补丁,那么攻击者很有可能在短短30分钟内,就通过逆向工程找出这个补丁本来要修复的漏洞。所以补丁一旦发布,银行必须建立一套流程,确保比当前市场快得多的速度修复漏洞。”欧洲央行监管委员会副主席弗兰克·埃尔德森在采访中表示。

在他看来,当务之急是提高漏洞的修补速度。尤其对于大量依赖传统IT架构运行的金融机构,是一次安全大考。

02 为什么是Mythos?

不同于面向普通消费者的聊天大模型,Mythos专长于编程,是Claude产品线的最新升级,也被视为最强Claude模型。

技术报告显示,在软件工程测试SWE-bench Verified上,Mythos得分93.9%,上一代模型Opus 4.6是80.8%;在网络安全能力评估CyberGym测试中,Mythos得分83.1%,也远高于Opus 4.6的66.6%。

Anthropic在博客中强调,公司并没有专门训练Mythos的网络安全用途,但当模型的编程、推理和自主执行能力同步增强后,它自然会获得更强的漏洞发现与利用能力。换句话说,捕捉安全风险是模型能力整体提升的副产品。

这种能力对网络安全到底意味着什么?Anthropic在自我报告中提到,Mythos在过去几周发现了数千个零日漏洞——零日漏洞指极其危险的缺陷,开发人员必须在零日内修复。这些漏洞覆盖几乎所有主流操作系统和浏览器。

其中一个最受关注的案例,来自操作系统OpenBSD。Anthropic称,Mythos发现了一个已经潜伏27年的漏洞。自1998年发布以来,OpenBSD一直被视为业内安全加固程度最高的操作系统之一,也是全球大量防火墙和关键设施的地基。

更值得担忧的是,Mythos找到漏洞后,能进一步执行攻击。Anthropic内部测试写道,Mythos生成漏洞利用代码的成功率达到72.4%,前一代Opus 4.6的成功率几乎为零。

网络安全是攻防双方的平衡术,有利于攻击者的技术,也有利于防御者。“我们相信,强大的技术能力最终会使防御方比攻击方受益更多。但如果前沿实验室发布这些模型不够谨慎,短期内攻击方就可能会占据优势——尤其是过渡期,场面会很混乱。”Anthropic写道。

玻璃之翼(Project Glasswing)的策略正建立在这种判断上。Anthropic最终决定,Mythos不直接面向公众开放,而是优先向一部分大型机构提供访问权。在能力全面扩散前,先让防御方抢跑一步。

但玻璃之翼引发了新的担忧,如果最先进的技术能力只向少数人开放,技术差距也会成为一种安全风险。

首批获得Mythos权限的有12家核心合作伙伴和40多家关键基础设施机构,几乎全由美国科技与金融巨头构成,包括亚马逊、苹果、谷歌、英伟达、思科、摩根大通、Linux基金会等。除了美国,英国是目前唯一确认获得Mythos预览版的政府,其渠道是英国人工智能安全研究所(AISI)。

欧洲央行和监管机构尤其感到艰难,因为他们被拒绝使用Mythos。欧洲央行监管着欧元区约111家大型银行,摩根大通等华尔街大型银行的子公司已经获得了Mythos的测试版本,但欧洲监管方却无法直接接触。

“所有相关机构都应该获得此类技术,避免竞争扭曲。”德国央行行长只能在4月的公开演讲中呼吁。

03 需要紧张吗?

由于大多数人至今无法直接接触Mythos,外界对于它真实能力的判断,以及AI到底会不会颠覆网络安全,没有人能够给出明确答案。

不少人把Mythos形容为网络安全领域的“奥本海默时刻”,值得紧张的外部案例确实不少。

比如一家网络安全公司Calif的研究人员,利用Mythos的早期版本,在macOS中发现两个此前未被记录的漏洞。这两个漏洞可被串联利用形成攻击路径,进而获取权限,可以绕过苹果最先进的内存完整性保护机制;如果再结合其他攻击手段,甚至可能完全控制一台Mac设备。

英国人工智能安全研究所(AISI)同时拿到了Mythos和GPT 5.5模型,其最新测试报告显示,Mythos之后,ChatGPT 5.5已经成为第二个具备全自动网络攻击能力的大模型。

报告里有一个关键指标叫“Cyber Time Horizon(网络攻击时间跨度)”,用来衡量AI能连续自主完成多长时间的人类工作,时间跨度越长,意味着AI离真正的全自动黑客越近。

2025年11月,团队估计这个指标每8个月会翻倍一次;到了今年2月,数字已经缩短到4.7个月;Mythos出现后,进化周期又压缩了。

但另一种怀疑声同样存在:Mythos的风险被夸大了,它很可能是AI行业常见的炒作营销。

开源工具curl的创始人丹尼尔·斯坦伯格就公开表达过质疑。通过Linux基金会,curl间接获得了Mythos对curl代码库的分析结果。报告声称发现五个漏洞,但斯坦伯格后续核查发现,只有一个是真实漏洞;三个是API文档早已说明的问题,另一个则只是普通Bug。

在斯坦伯格看来,AI的能力确实在提升,但距离革命性突破仍有距离。

类似判断也出现在Mozilla的测试中。Mozilla过去长期使用GPT-4和Sonnet3.5对Firefox进行安全分析,但一直受困于高误报率,很难真正大规模投入使用。相比之下,Mythos的能力提升是明显的,其一次性识别出了271个潜在漏洞。

但Mozilla同时强调,这并不等于真实的网络攻击,因为大多数情况下,单个漏洞并不足以攻破复杂的防御架构。更重要的是,Mythos并没有发现人类识破不了的安全漏洞,只是速度和效率提升了。

一个细节也能说明问题。Mozilla团队会让Mythos生成补丁建议作为参考,但最终完成修复工作的仍然是人类工程师,团队还没有发现能够完全自动化解决的方法。

AISI对此的最终判断是:AI正在快速接近自主执行复杂攻击流程的边界,而这种进化速度,明显快于传统安全行业的适应速度,留给防守方的缓冲时间不会太长。

这或许才是引发恐慌的根源。当下是一个关键窗口期,谁能更快建立防御体系,谁就能在未来拉开差距。

进一步说,答案不只是谁能防御Mythos,更是谁有能力造出下一个Mythos。在第三方模型评估榜单Artificial Analysis中,编程模型榜单的前十名被Claude、Cursor、ChatGPT轮流承包,国内的智谱GLM-5.1为第十六名,前二十名里还有Kimi K2.6、DeepSeekV4。一些分析认为,中美之间前沿大模型的技术差距正在缩小。

声明:本文来自竞争秩序场,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。