发现上万个高危和严重漏洞：Anthropic“玻璃之翼”项目揭示AI网络安全新挑战

编者按

根据美国人工智能公司Anthropic 于5月22日发布的声明，该公司4月启动的“玻璃之翼”网络安全项目利用尚未发布的Claude Mythos预览版模型，已自主发现全球最关键软件系统中超过10000个高危和严重级别漏洞。

Anthropic公司表示，软件安全进展过去受限于发现新漏洞的速度，但如今受限于验证、披露和修复人工智能发现的大量漏洞的速度；由于行业标准的漏洞披露惯例的存在，目前已公开的漏洞数量无法体现人工智能模型发现漏洞的真实能力；目前还无法在不危及最终用户安全的情况下，全面披露合作伙伴通过Mythos预览版模型发现的所有漏洞；自“玻璃之翼”项目启动以来，Anthropic公司和约50家合作伙伴利用Mythos预览版模型在全球最重要的系统性软件中发现了超过10000个高危或严重漏洞; 部分合作伙伴表示漏洞发现率提高了10倍以上，例如Cloudflare在其关键路径系统中发现了2000个漏洞（其中400个为高危或严重漏洞），其误报率低于人工测试人员；上述动态与外部测试人员对Mythos预览版模型性能的体验以及最近对该模型的其他评估相符；当前，软件补丁的发布速度大大加快，例如派拓网络公司最新发布的版本包含的补丁数量是以往的5倍多，微软公司也表示即将发布的新补丁数量“将在一段时间内继续保持增长趋势”，甲骨文公司发现并修复其产品和云平台漏洞的速度也比以往快了数倍。

Anthropic公司指出，在过去的几个月里，该公司使用Mythos预览版模型扫描了1000多个开源项目，并在这些项目中发现了23019个漏洞，其中6202个高危或严重的漏洞；目前，已有1752个高危或严重漏洞由独立的安全研究公司进行了仔细评估，少数漏洞则由该公司自行评估，其中90.6%（1587个）被证实为有效漏洞，62.4%（1094个）被确认为高危或严重级别；上述结果意味着，即使Mythos预览版模型不再发现其他漏洞，按照目前的漏洞检出率，它也将累计发现近3900个开源代码中的高危或严重级别漏洞；Mythos预览版模型检测到的一个开源漏洞示例是wolfSSL，该模型构建了一个漏洞利用程序，攻击者可以利用该程序伪造证书；该公司目前已向维护人员披露了530个高危或严重漏洞，并计划尽快公布另外827个已确认的高危或严重漏洞。

Anthropic公司强调，与修复漏洞的难度相比，发现漏洞相对容易，这给网络安全带来了巨大挑战；面对Mythos类模型将很快得到更广泛的应用的形势，软件行业需要加大力度，以应对这些模型将产生的大量分析结果；目前，漏洞的发现、补丁的创建以及补丁被最终用户广泛部署之间通常存在较长的时间滞后，这为攻击者利用关键软件漏洞留下了很大的可乘之机；Mythos类模型显著缩短了发现和利用漏洞所需的时间和成本，但也因此加剧了时间滞后带来的风险；Mythos类模型最终将使开发人员能够在软件部署前捕获漏洞，从而构建更加安全的软件，但在漏洞被快速发现而补丁缓慢修复的过渡时期，也带来了新的风险；软件开发人员和用户应立即采取行动以降低相关风险，其中软件开发者应缩短补丁周期并尽快发布安全修复程序，网络防御者应缩短补丁测试和部署周期。

奇安网情局编译有关情况，供读者参考。

"玻璃之翼"项目：初步更新

4月，Anthropic公司启动了“玻璃之翼”（Project Glasswing）项目，这是为保护世界上最关键的软件而开展的合作项目，旨在防止功能日益强大的人工智能模型反过来对付它。

自那时起，Anthropic公司和大约50家合作伙伴利用Claude Mythos预览版模型在全球最重要的系统性软件中发现了超过10000个高危或严重漏洞。过去，软件安全进展受限于发现新漏洞的速度。如今，它受限于验证、披露和修复人工智能发现的大量漏洞的速度。

在本文中，Anthropic公司将探讨在“玻璃之翼”项目启动的最初几周里，对网络安全这一关键挑战的认识。Anthropic公司将重点介绍Mythos预览版早期公开的性能表现、扫描数千个开源软件项目的初步成果，以及这些进展对当今网络防御者的意义。此外，Anthropic公司还将展望“玻璃之翼”项目的下一步计划，以及未来发布Mythos级模型的设想。

一

初步结果

讨论Mythos预览版研究结果的方法

软件行业长期以来的惯例是在发现新漏洞后90天披露（如果补丁在90天期限前发布，则在补丁发布后约45天披露）。这为最终用户提供了更新软件的时间，以便在漏洞被攻击者利用之前进行更新。Anthropic公司自身的协调漏洞披露政策也采用了这种方法。

然而，这意味着已披露的漏洞并不能完全反映人工智能模型网络安全能力快速发展的现状：目前还无法在不危及最终用户安全的情况下，全面披露合作伙伴通过Mythos预览版模型发现的所有漏洞。因此，Anthropic公司仅提供模型性能的示例，以及迄今为止的总体统计数据。一旦Mythos预览版模型发现的漏洞补丁得到广泛部署，Anthropic公司将提供更多关于所获信息的详细信息。

来自合作伙伴和外部测试人员的证据

“玻璃之翼”项目的初始合作伙伴构建并维护着对互联网和其他重要基础设施运行至关重要的软件。修复其代码中的缺陷可以降低依赖这些代码的众多其他组织的风险，从而降低数十亿最终用户的风险。

1个月后，大多数合作伙伴都在各自的软件中发现了数百个严重或高危漏洞。总计，他们发现了超过10000个漏洞。一些合作伙伴表示，他们的漏洞发现率提高了10倍以上。例如，Cloudflare在其关键路径系统中发现了2000个漏洞（其中400个为高危或严重漏洞），其误报率低于人工测试人员。

这与外部测试人员对Mythos预览版模型性能的体验以及最近对该模型的其他评估相符：

英国人工智能安全研究所报告称，Mythos预览版模型是第一个能够端到端解决其两个网络靶场（多步骤网络攻击模拟）问题的模型；
Mozilla在测试Mythos预览版模型时，在Firefox 150中发现了271个漏洞并进行了修复——比在安装了Claude Opus 4.6的Firefox 148中发现的漏洞数量多10倍以上；
独立安全平台XBOW报告称，Mythos预览版模型在其网络漏洞利用基准测试中“比所有现有模型都有了显著的提升”，并且在逐个词元的基础上提供了“绝对前所未有的精确度”；
ExploitBench和ExploitGym是两款近期发布的学术基准测试工具，用于衡量模型的漏洞利用开发能力。测试结果显示，Mythos预览版模型表现最为出色。

更普遍而言，Anthropic公司现在看到软件补丁的发布速度大大加快。Palo Alto Networks 最新发布的版本包含的补丁数量是以往的5倍多。微软也表示，他们即将发布的新补丁数量“将在一段时间内继续保持增长趋势”。而Oracle发现并修复其产品和云平台漏洞的速度也比以往快了好几倍。

Mythos预览版模型也被证明对其他类型的安全工作也很有用。例如，在一家“玻璃之翼”项目合作银行，Mythos预览版模型帮助检测并阻止了一起150万美元的欺诈性电汇，此前攻击者入侵了客户的电子邮件账户并拨打了欺骗性电话。

二

开源软件

在过去的几个月里，Anthropic公司使用Mythos预览版模型扫描了1000多个开源项目，这些项目共同支撑着互联网的大部分内容，以及大部分基础设施。

到目前为止，Mythos预览版模型已在这些项目中发现了估计为6202个高危或严重的漏洞（总共有23019个漏洞，包括估计为中危或低危的漏洞）。

目前，已有1752个高危或严重漏洞由6家独立的安全研究公司之一进行了仔细评估，少数漏洞则由Anthropic公司自行评估。其中，90.6%（1587个）被证实为有效漏洞，62.4%（1094个）被确认为高危或严重级别。这意味着，即使Mythos预览版模型不再发现其他漏洞，按照目前的漏洞检出率，它也将累计发现近3900个开源代码中的高危或严重级别漏洞——这还不包括它为“玻璃之翼”项目的合作伙伴发现的漏洞。需要说明的是，Anthropic公司计划在一段时间内继续扫描开源代码，因此预计这个数字还会上升。

Mythos预览版模型检测到的一个开源漏洞示例是wolfSSL，这是一个以安全性著称的开源加密库，被全球数十亿台设备使用。Mythos预览版模型构建了一个漏洞利用程序，攻击者可以利用该程序伪造证书，例如，伪造银行或电子邮件提供商的网站。尽管该网站由攻击者控制，但对最终用户而言，它看起来完全合法。Anthropic公司将在未来几周内发布针对此漏洞（现已修复，漏洞编号为CVE-2026-5194）的完整技术分析。

正如前面所提，修复这类漏洞的瓶颈在于人工能力，即能否对漏洞进行分类、报告、设计和部署补丁。而Mythos预览版模型的出现，使得漏洞的发现变得更加直接。Anthropic公司在下方创建了一个开源漏洞扫描仪表板，展示了披露流程的各个步骤，并将跟踪随时间的进展。该仪表板显示了所有级别的漏洞，而不仅仅是Mythos预览版最初评估为高危或严重级别的漏洞子集。请注意每个阶段漏洞数量的急剧下降，这反映了验证和修复每个漏洞所需的人工投入。

Anthropic公司的漏洞分级流程非常严谨。首先，Anthropic公司或与Anthropic公司合作的外部安全公司会重现Mythos发现的问题，并重新评估其严重性。一旦确认漏洞真实存在，会检查是否已有修复方案，并向软件维护者提交一份详细的报告。Anthropic公司在此环节格外谨慎：除了维护开源软件本身的挑战之外，维护者还面临着大量低质量的、由人工智能生成的错误报告。事实上，一些维护者告诉Anthropic公司，他们目前严重缺乏资源，甚至有些维护者要求Anthropic公司放慢漏洞披露的速度，因为他们需要更多时间来设计补丁。（平均而言，Mythos预览版模型发现的高危或严重漏洞需要2周时间才能修复。）

应维护者要求，Anthropic公司有时会直接披露漏洞，而无需进一步评估。目前Anthropic公司已报告了1129个此类未经审查的漏洞，其中Mythos预览版模型估计有175个属于高危或严重级别。

Anthropic公司估计目前已向维护人员披露了530个高危或严重漏洞。这一数字基于Claude对直接披露漏洞严重性的评估，以及维护人员或安全合作伙伴在可获得评估的情况下提供的评估。此外，还有827个已确认的漏洞（以同样的方式评估为高危或严重漏洞），Anthropic公司正努力尽快披露这些漏洞。

在Anthropic公司报告的530个高危或严重漏洞中，已有75个漏洞得到修复，其中65个已发布公开公告。目前补丁数量仍然相对较少，原因有三。首先，Anthropic公司仍处于协调漏洞披露政策规定的90天窗口期初期：预计很快会有更多补丁发布。其次，Anthropic公司可能低估了补丁数量，因为有些漏洞的修复并未发布公开公告：在这种情况下，需要使用Claude自行扫描来查找补丁。第三，补丁数量少反映了一个实际存在的问题：即使披露的速度相对较慢，Mythos预览版模型也加剧了本已不堪重负的安全生态系统的压力。

与修复漏洞的难度相比，发现漏洞相对容易，这给网络安全带来了巨大挑战。成功应对这一挑战将使软件比以往更加安全。下文将探讨网络防御者可以采取的一些应对措施。

三

适应网络安全的新阶段

与Mythos预览版模型具备类似网络安全技能的模型将很快得到更广泛的应用。软件行业显然需要加大力度，以应对这些模型将产生的大量分析结果。

目前，漏洞的发现、补丁的创建以及补丁被最终用户广泛部署之间通常存在较长的时间滞后。这为攻击者利用关键软件漏洞留下了很大的可乘之机。Mythos类模型显著缩短了发现和利用漏洞所需的时间和成本，但也因此加剧了这些时间滞后带来的风险。最终，Mythos类模型将使开发人员能够在软件部署前捕获漏洞，从而构建更加安全的软件。然而，在漏洞被快速发现而补丁缓慢修复的这段过渡时期，也带来了新的风险。

软件开发人员和用户应立即采取行动，降低这些风险。以下建议并非新观点，许多研究人员（包括Anthropic的研究人员）目前正在致力于开发更好、更持久的解决方案。与此同时，做好基础工作至关重要：

软件开发者应缩短补丁周期，并尽快发布安全修复程序。合理利用公开的AI模型可以为此提供帮助；Anthropic公司正在开发相关工具并分享研究成果以支持这一目标。开发者还应帮助用户保持软件更新，尽可能简化更新安装流程；在可行的情况下，对于仍在运行已知漏洞软件的用户，开发者应更加积极主动地进行更新。
网络防御者应缩短补丁测试和部署周期。美国国家标准与技术研究所（NIST）和英国国家网络安全中心（NCSC）等机构制定的关键控制措施如今显得尤为重要，因为它们无需依赖任何单个补丁的及时发布即可提升安全性。这些措施包括强化网络默认配置、强制执行多因素身份验证以及保留用于检测和响应的完整日志。

四

利用公开可用的人工智能模型进行网络防御的工具

许多通用的漏洞模型已经能够发现大量的软件漏洞，即使它们无法发现最复杂的漏洞或像Claude Mythos预览版模型那样有效地利用这些漏洞。“玻璃之翼”项目已经促使许多其他组织利用这些通用模型对其代码库采取行动；Anthropic公司正在努力使这一过程更加便捷。

首先，Anthropic公司面向Claude企业客户发布了Claude Security的公开测试版。该工具可以帮助团队扫描代码库中的漏洞，并生成相应的修复方案。自发布以来的3周内，Claude Opus 4.7已用于修复超过2100个漏洞。（这比上文所述的开源修复速度更快，主要原因是企业自行修复代码，而开源修复通常需要志愿者维护者通过协调披露的方式进行。）

Anthropic公司还启动了网络验证计划，该计划允许安全专业人员出于合法的网络安全目的（例如漏洞研究、渗透测试和红队演练）使用Anthropic公司的模型，而无需采取某些旨在防止网络滥用的安全措施。

现在，Anthropic公司将本公司及合作伙伴在Mythos预览版模型中使用的工具提供给符合条件的客户的安全团队，供其申请使用。Anthropic公司的目标是让用户无需进行大量设置即可轻松发挥高性能公有模型的最佳性能。此版本包含：

Anthropic公司和公司合作伙伴已经建立和分享的技能（用于重复工作的自定义指令）；
一个帮助Claude绘制代码库图、启动扫描子代理、对扫描结果进行分类并编写报告的工具；
一个威胁模型构建器，它映射代码库以识别潜在的攻击目标，并据此确定模型工作的优先级。

思科是“玻璃之翼”项目合作伙伴之一，最近也开源了其Foundry 安全规范，以帮助其他防御者构建类似于他们自己使用的评估系统。

五

支持生态系统

Anthropic公司已与开源安全基金会的Alpha-Omega项目建立合作关系，该项目将支持基金会协助维护人员处理和分类漏洞报告。Anthropic公司还将继续发布研究成果，探讨如何利用前沿模型功能更好地支持网络安全防御人员。

Anthropic公司还支持了ExploitBench和ExploitGym的开发，这两个新的基准测试工具能够帮助研究人员追踪前沿AI模型的漏洞利用开发能力随时间的变化。Anthropic公司正通过“外部研究人员访问计划”（ERAP）支持其他高质量定量基准测试工具的开发。最后，Claude for Open Source为维护者和贡献者提供支持，并且Anthropic公司承诺，未来采用的任何开源软件包都将进行扫描。

六

“玻璃之翼”计划的下一步是什么？

人工智能的飞速发展意味着，许多人工智能公司很快就会开发出与 Mythos Preview 功能相当的模型。目前，包括Anthropic在内的任何公司都尚未开发出足够强大的安全措施来防止此类模型被滥用并造成严重危害。正因如此，Anthropic公司至今仍未向公众发布Mythos级别的模型。但这同时也是Anthropic公司启动“玻璃之翼”项目的原因：如果一款功能类似的模型在缺乏此类安全措施的情况下被发布，那么世界上几乎任何人都能以极低的成本和极低的成本利用软件漏洞。

“玻璃之翼”项目帮助那些在网络安全领域扮演关键角色的组织获得非对称优势。然而，尽可能多的组织迫切需要加强其网络防御。Anthropic公司希望公开提供的模型，以及与之配套的新工具、资源和研究成果，能够帮助这些组织提升其网络安全态势。

接下来，Anthropic公司将与包括美国及其盟国政府在内的重要合作伙伴携手，将“玻璃之翼”项目拓展至更多合作伙伴。在不久的将来，一旦开发出更强大的安全保障措施，Anthropic公司期待通过公开发布的方式推出Mythos级模型。

克服这些风险之后，将迎来一个令人鼓舞的未来：一个重要代码的安全性远胜于今日，黑客攻击也远不那么普遍的未来。尽管困难重重，但Anthropic公司仍然坚信，“玻璃之翼”项目能够帮助实现这一目标。

声明：本文来自奇安网情局，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

发现上万个高危和严重漏洞：Anthropic“玻璃之翼”项目揭示AI网络安全新挑战

警惕Underminr新型网络规避技术：CDN共享边缘的隐形漏洞

沉睡通道：面向Agent的持久化提示注入

万万没想到！网站能识别AI Agent背后的模型