潘多拉模型：Anthropic模型或将颠覆网络安全格局并重塑美国网络攻防行动

编者按：美国人工智能公司Anthropic于4月7日宣布，鉴于其尚未公开发布的前沿模型Claude Mythos预览版，在自主识别和利用软件漏洞方面展现出远超现有模型的卓越能力，决定暂缓发布该模型，并发起“玻璃之翼项目”，旨在将该模型用于防御目的，为修复全球关键软件的安全缺陷争取时间。业界认为，此举标志着人工智能将在漏洞发现和利用环节颠覆传统网络安全格局，并可能从根本上重塑美国网络攻防行动。

Claude Mythos预览版是Anthropic公司尚未公开发布的通用型前沿模型，性能显著优于Anthropic公司此前发布的三款模型（Haiku、Sonnet、Opus）。该模型强大的网络能力源于其强大的智能体编码和推理能力，评估结果显示，该模型在编码、推理、代理搜索和计算机使用等任务中均取得最高分，性能显著超越该公司次优模型Claude Opus 4.6。Anthropic公司称，该模型已完全自主地识别出数千个零日漏洞，几乎涵盖所有主流操作系统、网络浏览器以及一系列重要软件，同时还针对相关漏洞开发了日益复杂的利用程序。Anthropic公司出于网络安全风险考虑，决定暂缓推出Claude Mythos预览版模型，同时启动一项研究该模型对全球网络影响的“玻璃之翼项目”，旨在帮助保护关键软件免受人工智能驱动的攻击。

Anthropic公司表示，随着最新前沿人工智能模型的出现，发现和利用软件漏洞所需的成本、精力和专业知识水平都大幅下降；鉴于人工智能的发展速度，此类能力很快就会扩散，甚至可能超出致力于安全部署它们的机构的掌控，这将对经济、公共安全和国家安全造成严重后果；若缺乏必要的安全保障，人工智能所带来的强大网络能力可能被用来攻击全球最重要软件中存在的诸多漏洞，导致各类网络攻击更加频繁、更具破坏性，并增强美国及其盟友的对手的实力；Claude Mythos预览版模型已展现出“重塑网络安全格局”的能力，彰显人工智能模型的编码能力已经达到了极高的水平，在发现和利用软件漏洞方面几乎已经能够与人类顶尖高手相媲美。

“玻璃之翼项目”旨在将人工智能模型强大的漏洞发现能力用于防御目的，让防御者在即将到来的“人工智能驱动的网络安全时代”获得持久优势，帮助修复关键软件中的安全缺陷。该项目汇集了苹果、微软、谷歌、思科、英伟达等众多美国科技巨头、网络安全企业以及非营利性技术机构。Anthropic公司将向该项目合作伙伴提供Claude Mythos预览版模型的访问权限，以便查找并修复其基础系统中的漏洞或弱点。预计此项工作将侧重于本地漏洞检测、二进制文件黑盒测试、端点安全保护以及系统渗透测试等任务。Anthropic将为Claude Mythos预览版模型在这些项目中提供高达1亿美元的使用额度，并向开源安全组织直接捐赠400万美元。

业界评析认为，Claude Mythos预览版模型标志着人工智能在安全领域的应用能力从辅助工具跃升至主要研究者；人工智能能力已经跨越了一个临界点，从根本上改变了保护关键基础设施免受网络威胁的紧迫性，而且这种趋势不可逆转；人工智能模型可以帮助人类以前所未有的速度和规模识别并修复硬件和软件中的安全漏洞，这种意义深远的转变表明传统的系统加固方式已难以为继；对Claude Mythos预览版的受控访问为防御者争取了时间，但其扩散时间是“以月而非年”来计算的；人工智能生成的代码需要以同样速度进行对抗性审查，只有嵌入开发流程的人工智能原生安全工具才能应对。

Anthropic公司已向美国政府机构通报Claude Mythos预览版模型的全部功能，包括进攻性和防御性网络应用，如美国网络安全和基础设施安全局、国家标准与技术研究所的人工智能标准与创新中心等。消息人士透露，美国情报界正在关注该模型，希望利用该模型保护代码并发现网络漏洞；美国国家安全局内部分析人员也一直在非正式地讨论该模型。与美国情报界有业务往来的网络安全公司关注该事态发展并表示担忧，认为该模型将引发网络防御挑战，同时担忧其扩散至外国对手的风险。前美国网络司令部高官认为，该模型在识别和利用敌方系统弱点方面具有“巨大的潜力”，可用于进攻性网络行动；由于网络攻防一体性，美国在利用敌方漏洞的同时，也必须能防御自身关键基础设施中的相同漏洞。

奇安网情局编译有关情况，供读者参考。

美国人工智能公司Anthropic于4月7日宣布启动“玻璃之翼项目”（Project Glasswing）。该项新计划汇集了亚马逊网络服务、Anthropic、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达和Palo Alto Networks等公司，旨在保护世界上最关键的软件。

Anthropic公司表示，成立“玻璃之翼”项目的原因是观察到该公司训练的新型前沿模型展现出的能力，相信该模型能够“重塑网络安全格局”。Anthropic公司表示，Claude Mythos预览版是一款通用型、尚未发布的前沿模型，它揭示了一个严峻的事实：人工智能模型的编码能力已经达到了极高的水平，在发现和利用软件漏洞方面，它们几乎可以超越除最熟练的人类之外的所有人。

Anthropic公司表示，Claude Mythos预览版模型已经发现了数千个高危漏洞，几乎涵盖了所有主流操作系统和网络浏览器；鉴于人工智能的发展速度，此类能力很快就会扩散，甚至可能超出那些致力于安全部署它们的机构的掌控，这将对经济、公共安全和国家安全造成严重后果；“玻璃之翼”项目正是为了将这些能力应用于防御目的而紧急发起的一项尝试。

作为“玻璃之翼项目”的一部分，相关合作伙伴将把Claude Mythos预览版模型应用于其防御性安全工作中；Anthropic公司将分享经验，使整个行业受益。此外，Anthropic公司还向40多个构建或维护关键软件基础设施的组织开放了访问权限，以便其能够使用该模型扫描和保护第一方系统和开源系统。Anthropic将为Claude Mythos预览版模型在这些项目中提供高达1亿美元的使用额度，并向开源安全组织直接捐赠400万美元。

Anthropic公司称，“玻璃之翼项目”只是一个起点，没有任何一个组织能够独自解决这些网络安全问题，前沿人工智能开发者、其他软件公司、安全研究人员、开源维护者以及世界各国政府都扮演着至关重要的角色；保护全球网络基础设施的工作可能需要数年时间，而前沿人工智能能力很可能在未来几个月内取得显著进步；为了让网络防御者最终胜出，必须立即行动。

人工智能时代的网络安全

当今社会日常依赖的软件——负责运行银行系统、存储医疗记录、连接物流网络、维持电网运行等等——一直都存在漏洞。许多漏洞微不足道，但有些却是严重的安全缺陷，一旦被发现，网络攻击者就可能劫持系统、扰乱运营或窃取数据。

网络攻击已经对重要企业网络、医疗系统、能源基础设施、交通枢纽以及世界各地政府机构信息安全造成的严重后果。在全球范围内，国家支持的网络攻击威胁着支撑民生和军事战备的基础设施。即使是针对个别医院或学校等规模较小的攻击，也可能造成巨大的经济损失，泄露敏感数据，甚至危及生命。目前网络犯罪造成的全球经济损失难以估算，但可能高达每年5000亿美元左右。

许多软件缺陷多年来一直未被发现，因为发现和利用这些缺陷需要只有少数技术娴熟的安全专家才能掌握的专业知识。随着最新前沿人工智能模型的出现，发现和利用软件漏洞所需的成本、精力和专业知识水平都大幅下降。过去一年，人工智能模型在读取和推理代码方面变得越来越有效——尤其是在发现漏洞和找出利用方法方面，它们展现出了惊人的能力。Claude Mythos预览版模型展示了这些网络技能的飞跃——它发现的某些漏洞甚至经受住了数十年的人工审查和数百万次的自动化安全测试，而且它开发的漏洞利用程序也越来越复杂。

在首届美国国防高级研究计划局（DARPA）网络挑战赛举办十年后，前沿人工智能模型在发现和利用网络漏洞方面已能与人类顶尖高手相媲美。若缺乏必要的安全保障，这些强大的网络能力可能被用来攻击全球最重要软件中存在的诸多漏洞。这将导致各类网络攻击更加频繁、更具破坏性，并增强美国及其盟友的对手的实力。

人工智能模型之所以危险，正是因为它们具备在不法分子手中造成危害的能力，同时也使其在发现和修复重要软件缺陷以及开发安全漏洞更少的新软件方面具有不可估量的价值。“玻璃之翼项目”是让防御者在即将到来的人工智能驱动的网络安全时代获得持久优势的重要一步。

利用Claude Mythos预览版

识别漏洞与利用手段

Mythos并非渐进式改进，而是性能上的飞跃式提升，超越了Anthropic公司目前推出的三款前沿模型：Haiku（最小）、Sonnet（中等）和 Opus（最强大）。Mythos 属于第四层级 Copybara，Anthropic公司称其优于任何其他现有的AI前沿模型。

在过去的几周里，Anthropic公司使用Claude Mythos预览版识别出了数千个零日漏洞，其中许多漏洞非常严重，这些漏洞存在于每个主要操作系统和每个主要网络浏览器以及一系列其他重要软件中。

Anthropic公司详细介绍了部分已修复的漏洞，并在某些情况下介绍了Claude Mythos预览版模型发现的利用这些漏洞的方法。Claude Mythos预览版模型完全自主地识别出了几乎所有这些漏洞，并开发了许多相关的利用程序，无需任何人工干预。以下是三个示例：

Claude Mythos预览版模型发现OpenBSD中存在一个27年前的漏洞——OpenBSD 被誉为世界上安全性最高的操作系统之一，常用于运行防火墙和其他关键基础设施。该漏洞允许攻击者通过连接到运行该操作系统的任何机器，远程使其崩溃。
Claude Mythos预览版模型还发现 FFmpeg（众多软件都用它来编码和解码视频）中存在一个16年前的漏洞，该漏洞存在于一行代码中，自动化测试工具已经攻击了500万次，但从未发现过这个问题。
Claude Mythos预览版模型自主发现并将Linux内核（运行着世界上大多数服务器的软件）中的几个漏洞串联起来，使攻击者能够从普通用户访问权限提升到对机器的完全控制。

Anthropic公司已将上述漏洞报告给相关软件的维护者，目前所有漏洞均已修复。对于其他许多漏洞，Anthropic公司将提供漏洞详情的加密哈希值，待修复完成后再公布具体细节。

CyberGym等评估基准进一步证实了Claude Mythos预览版模型与Anthropic公司次优型号Claude Opus 4.6模型之间的显著差异：

Claude Mythos预览版模型强大的网络能力源于其强大的智能体编码和推理能力。评估结果显示，该模型在各种软件编码任务中均取得了迄今为止所有模型中的最高分。

代理编码

推理

代理搜索和计算机使用

Anthropic公司宣称，目前不打算公开发布Claude Mythos预览版模型，但最终目标是让用户能够安全地大规模部署Mythos级模型——这不仅是为了网络安全，也是为了利用这些功能强大的模型带来的诸多其他益处；为此，需要在开发网络安全（以及其他方面）安全措施方面取得进展，这些措施能够检测并阻止模型最危险的输出；该公司计划在即将发布的Claude Opus模型中推出新的安全措施，以便能够利用风险级别低于Claude Mythos预览版的模型来改进和完善这些措施。

“玻璃之翼项目” 计划

Anthropic公司将向“玻璃之翼项目”合作伙伴提供Claude Mythos预览版模型的访问权限，以便查找并修复其基础系统中的漏洞或弱点——这些系统占据了全球共享网络攻击面的很大一部分。预计此项工作将侧重于本地漏洞检测、二进制文件黑盒测试、端点安全保护以及系统渗透测试等任务。

Anthropic公司承诺向“玻璃之翼项目”及其他参与者提供价值1亿美元的模型使用额度，这将足以覆盖本次研究预览期间的大部分使用需求。此后，参与者可以以每百万输入/输出词元25美元/125美元的价格使用Claude Mythos预览版模型（参与者可以通过Claude API、Amazon Bedrock、Google Cloud的Vertex AI和Microsoft Foundry访问该模型）。

除承诺的模型使用额度外，Anthropic公司还通过Linux基金会向Alpha-Omega和OpenSSF捐赠了250万美元，并向Apache软件基金会捐赠了150万美元，以使开源软件的维护者能够应对这种不断变化的环境（有兴趣获得访问权限的维护者可以通过Claude for Open Source计划申请）。

Anthropic公司计划扩大这项工作的范围并持续数月，将尽可能多地分享经验，以便其他组织能够将这些经验应用到自身的安全工作中。合作伙伴将在力所能及的范围内相互分享信息和最佳实践；Anthropic公司将在90天内公开报告所获得的经验，以及已修复的漏洞和已进行的改进。Anthropic公司还将与领先的安全组织合作，制定一套关于人工智能时代安全实践应如何发展的实用建议。这些建议可能包括：

漏洞披露流程；
软件更新流程；
开源和供应链安全；
软件开发生命周期和安全设计实践；
受监管行业的标准；
分类/分流（Triage）规模化和自动化；
补丁自动化。

Anthropic公司还表示，该公司一直在与美国政府官员就Claude Mythos预览版模型及其攻防网络能力进行磋商；保障关键基础设施安全是民主国家最重要的国家安全优先事项，这些网络能力的出现也正是美国及其盟友必须在人工智能技术领域保持绝对领先地位的另一个原因；各国政府在帮助保持这一领先地位以及评估和降低人工智能模型相关的国家安全风险方面发挥着至关重要的作用；该公司随时准备与地方、州和联邦政府代表合作，协助完成这些工作。

人工智能漏洞检测已跨越阈值

从巴顿·米勒在1989年首次使用“模糊测试”技术，到2023-2025年的美国国防高级研究计划局人工智能网络挑战赛（AIxCC），利用机器学习和人工智能解决安全漏洞方面取得了显著进展。

Claude Mythos预览版模型能够自主地、无需人工干预地发现那些经过数十年人工审查和数百万次自动化测试后依然存在的缺陷，标志着人工智能在安全领域的应用能力从辅助工具跃升至主要研究者。

思科高级副总裁兼首席安全与信任官安东尼·格里科表示：“人工智能能力已经跨越了一个临界点，从根本上改变了保护关键基础设施免受网络威胁的紧迫性，而且这种趋势不可逆转。我们利用这些模型开展的基础性工作表明，我们可以前所未有的速度和规模识别并修复硬件和软件中的安全漏洞。这是一个意义深远的转变，也清楚地表明，传统的系统加固方式已不再足够。”

美国技术研究、咨询和媒体公司Futurum Group副总裁兼软件生命周期工程实践主管米奇·阿什利、副总裁兼网络安全与韧性业务负责人费尔南多·蒙特内格罗评析称，人工智能漏洞检测已经跨越了一个开发团队和安全团队既期待又担忧的门槛；对Claude Mythos预览版的受控访问为防御者争取了时间，但其扩散时间是以月而不是年来衡量的。

米奇·阿什利和费尔南多·蒙特内格罗认为，对于软件工程和平台团队而言，其影响远远超出安全运营：人工智能生成的代码现在需要以与其生成速度相同的对抗性审查，而只有在开发工作流程中运行的人工智能原生应用安全工具才能弥合这一差距。

对美国网络攻防行动的影响

Anthropic公司决定暂缓推出Claude Mythos预览版模型并同时启动研究该模型对全球网络影响的“玻璃之翼项目”，引发了关于此类工具将如何重塑美国情报界的黑客行动，以及如何利用这些工具来识别和利用敌方系统的弱点的讨论。

据消息人士透露，美国情报界正在对这一消息做出反应。该消息人士称：“他们希望保护代码，并利用人工智能来发现网络漏洞。”

Anthropic公司一位高管透露，在任何对外发布前，该公司已向美国政府高级官员详细介绍了Claude Mythos预览版模型的全部功能，包括进攻性和防御性网络应用。此次交流包括与美国网络安全和基础设施安全局（CISA）以及美国国家标准与技术研究所（NIST）人工智能标准与创新中心等机构的讨论。该高管称：“从一开始，让美国政府尽早了解该模型的功能、风险所在以及我们如何应对这些风险就是我们的首要任务。”

另一位知情人士透露，美国国家安全局内部的分析人员也一直在非正式地谈论Claude Mythos预览版模型的发布。

多个美国情报机构和国防部部门在网络进攻行动和美国网络安全防御中都扮演着重要角色。由于进攻性任务通常依赖于对目标防御系统的了解，因此，像Claude Mythos预览版模型这样的工具一旦落入不法分子之手，就可能帮助对手识别并利用关键系统中的漏洞。美国机构已经囤积了大量黑客攻击漏洞利用程序以备将来使用。

这一事态发展也引起了一些与美国情报界有业务往来的网络安全公司的极大关注和担忧。一家网络投资公司的高管对Anthropic模型能够识别漏洞的规模感到震惊称，称“要如何才能同时防御所有这些攻击呢？”专注于软件供应链风险的美国公司Hunted Labs联合创始人海登·史密斯表示，“玻璃之翼项目”的消息“令人恐惧且不祥”，因为目前还不清楚Claude Mythos预览版会如何被用于进攻，尤其是如果它落入外国敌对势力手中；该模型很有可能落入被视为对美国怀有敌意的政府手中，“即使经过严格审查，考虑到当前开源生态系统和软件供应链遭受的攻击，Mythos落入坏人手中的可能性也几乎是毋庸置疑的。”

由于互联网的大部分运行都依赖于世界各地开发者维护的广泛使用的开源软件，因此像Mythos这样的工具可能会发现支撑数字生态系统大部分部分的代码中的弱点。

美国国会也在关注Anthropic公司的开发项目。美国参议院情报委员会副主席、弗吉尼亚州民主党参议员马克·沃纳表示：“我们已经看到网络威胁行为者利用人工智能工具来提升自身能力，这危及政府、企业和消费者的安全和个人信息安全。随着人工智能极大地加速发现新漏洞，我希望业界也能相应地加快并重新调整漏洞修补的优先级。”

美国网络司令部前执行主管、普华永道网络、数据和技术风险服务负责人摩根·亚当斯基表示，观察人士已经等待了一段时间，希望出现像Claude Mythos预览版这样的模型，能够大规模地识别和利用网络漏洞。她称：“对于网络攻击领域的从业者，对于美国政府来说，从对抗的角度来看，这显然具有巨大的潜力。”

网络攻防在很多方面都是一体的。如果网络情报分析人员在敌方计算机网络中发现新的漏洞，那么美国系统也可能存在同样的漏洞。摩根·亚当斯基表示，“如果我们利用了敌对网络中的某些漏洞，我们就必须能够在我们自己的关键基础设施中防御它。”她还表示，人工智能领域将会涌现更多此类创新，因为“通常情况下，当这类模型出现时，其他模型也不会落后太远”。

Anthropic公司此前与美国国防部就美军在实际作战中使用该公司开发的Claude人工智能模型的问题产生分歧。美国“保卫民主基金会”人工智能研究员莉亚·西斯金德表示，“美国政府需要与Anthropic公司和解，并通过防止外国对手窃取模型来帮助他们和‘玻璃之翼’成员保持美国在人工智能领域的领先地位。Anthropic发出了负责任的呼吁，但对手们不会。外国对手已经在利用美国的AI模型来提升自身的能力，一旦达到Mythos的性能水平，他们就会将其武器化。”

声明：本文来自奇安网情局，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

潘多拉模型：Anthropic模型或将颠覆网络安全格局并重塑美国网络攻防行动

伊朗再次袭击巴林AWS云设施，冲突全面蔓延至关键数字基础设施

无声的猎杀：从F-15E折戟伊朗看非对称防空对美军电子战范式的冲击

美国战争部官员阐述技术与网络作战优势发展战略