编者按
6月8日至9日,美国人工智能公司Anthropic连续发布重要动态,在披露其先进人工智能模型可将N日漏洞的逆向利用时间从“数周”极致压缩至“数小时”的同时,同步宣布推出两款基于Mythos架构的最新强大模型Fable 5和Mythos 5。
Anthropic公司6月8日发文称,该公司Mythos预览版模型可以在数小时甚至数分钟内构建针对已知漏洞的有效攻击程序,表明人工智能显著增加了此前未被利用的N日漏洞所带来的威胁。Anthropic公司称,虽然零日漏洞备受关注,现实世界中很大一部分危害来自N日漏洞,N日漏洞在某些方面比零日漏洞更危险,因为补丁本身就为漏洞的修复提供了“路线图”;攻击者在软件供应商发布安全更新后可以进行“补丁差异比较”,找出具体的更改之处,然后逆向工程该补丁旨在修复的漏洞;这意味着有效的漏洞利用程序出现往往只是时间问题,但这种“补丁差异分析”历史上一直是一项缓慢而专业的工作,从而为防御者争取了时间,以便广泛部署更新;同时,由于逆向工程专业知识的匮乏,漏洞利用程序的开发一直是瓶颈所在,但前沿人工智能模型已基本消除了这一瓶颈;经过测试,Mythos预览版在几个小时内就提供了16个针对Firefox和Windows的有效漏洞利用程序;在关闭安全防护措施的情况下,该公司公开发布的模型也能构建漏洞利用程序,尽管构建的数量没有Mythos预览版模型多;现在,操作员只需花费几千美元,无需任何专业知识,几个小时内就能将一个月积累的漏洞补丁转化为可用的漏洞利用程序;上述动态意味着软件开发人员如今常用的典型补丁发布流程已经不再适用,因为这种流程建立在补丁“武器化”需要专家花费数周时间的假设之上,但 “N日”概念已经变得极具误导性,“N小时”更接近目前所处的实际情况;如今处于补丁空档期的用户面临的威胁比以往更大,而且随着人工智能模型功能的不断增强,风险只会持续增长,防御者应加快补丁部署速度以应对这一挑战;从历史上看,N日漏洞对维护缓慢或难以修补的系统造成的危害最大,尤其是工业控制系统、医疗设备和物联网设备。
Anthropic公司6月9日还宣布推出两款基于其先前受限的Mythos架构构建的全新强大AI模型,即Claude Fable 5和 Claude Mythos 5。Anthropic公司称,Fable 5是其迄今为止向公众发布的功能最强大的模型,在软件工程、科学研究、视觉识别和复杂知识工作任务等方面表现均超越了以往的Claude模型;Anthropic公司通过分类器为Fable 5设置安全措施,用于检测潜在的滥用行为,在检测到与网络安全、生物学、化学或蒸馏相关的请求时将自动由该公司功能次强模型Claude Opus 4.8处理;Mythos 5是Mythos预览版模型的升级版,拥有全球所有模型中最强大的网络安全能力;在大多数情况下,Mythos 5的性能与Mythos预览版相当,甚至更胜一筹,而价格却大幅降低;Mythos 5采用与Fable 5相同的底层模型,但在某些方面取消了安全防护措施;Mythos 5将首先通过与美国政府合作的“玻璃之翼计划”进行部署,目前仅向一小部分网络安全和基础设施合作伙伴提供访问权限。
奇安网情局编译有关情况,供读者参考。

美国人工智能巨头Anthropic于6月8日发文称,该公司Claude Mythos预览版模型可以在数小时甚至数分钟内构建针对已知漏洞的有效攻击程序。该公司表示,其最先进的模型可以将漏洞发现武器化,这表明人工智能在网络攻击中的广泛应用加剧了网络漏洞组织面临的威胁。该公司呼吁更新补丁手册,使其以“N小时”而非“N日”为单位,并且不应再假设利用补丁进行攻击需要数周时间。
Anthropic公司还于6月9日宣布推出两款基于其先前受限的Mythos架构构建的全新强大AI模型:Claude Fable 5和 Claude Mythos 5。Claude Fable 5现已广泛开放,而Claude Mythos 5目前仍仅限于一小部分网络安全和基础设施合作伙伴。Anthropic公司称,Fable 5和Mythos 5等模型的能力具有造福世界的潜力,这些模型帮助网络安全防御者保护了至关重要的软件。Fable 5和Mythos 5的定价为每百万个输入词元10美元和每百万个输出词元50美元,不到Claude Mythos预览版模型价格的一半。
大模型加剧N日漏洞威胁
过去几个月,Anthropic公司一直在撰写关于大语言模型网络安全能力的文章。该公司主要关注的是零日漏洞,即软件维护者未知的漏洞。但现实世界中很大一部分危害来自N日漏洞:这些漏洞已经公开披露,但仅在部分设备上进行了修补。攻击者利用尚未应用补丁的众多系统,也就是所谓的“补丁空档期”。
在某些方面,N日漏洞比零日漏洞更危险,因为补丁本身就为漏洞的修复提供了路线图。一旦软件供应商发布安全更新,攻击者就可以进行“补丁差异比较”:将补丁前后的源代码或二进制文件进行比较,找出具体的更改之处,然后逆向工程该补丁旨在修复的漏洞。这意味着,一个有效的漏洞利用程序出现往往只是时间问题。从历史上看,补丁差异分析一直是一项缓慢而专业的工作,这为防御者争取了时间,以便广泛部署更新。
Anthropic公司评估了大语言模型在多大程度上能够加速和自动化N日漏洞利用程序的开发过程。漏洞利用程序的开发并非实际N日攻击活动中的唯一步骤(目标发现、漏洞利用程序的投放以及检测规避也都需要时间和资源),但历史上,由于逆向工程专业知识的匮乏,漏洞利用程序的开发一直是瓶颈所在。

随着前沿模型的出现,这一瓶颈已基本消除。经过测试,Claude Mythos预览版在几个小时内就提供了16个针对Firefox和Windows的有效漏洞利用程序。在最近发布的18个Firefox安全补丁中,Claude Mythos预览版模型自主构建了8个可执行代码的漏洞利用程序。在21个Windows内核补丁(源代码不可用)中,该模型生成了8个完整的漏洞利用链,能够将低权限用户一路提升至完全SYSTEM控制权限。
Anthropic公司发现,在关闭安全防护措施的情况下,该公司的公开模型也能构建漏洞利用程序,尽管它们构建的数量不如Mythos预览版模型那么多。这表明,如今处于补丁空档期的用户面临的威胁比以往更大,而且随着模型功能的不断增强,风险只会持续增长。防御者应加快补丁部署速度以应对这一挑战。
Anthropic公司表示,当今的模型能够产生N日漏洞利用并不令人意外,只要有足够的时间和足够强大的工具,这种情况可能早已存在;但像Mythos预览版这样的模型改变了一切,改变的是漏洞发现的数量和速度;现在,一个操作员只需花费几千美元,无需任何专业知识,就能在一个下午将一个月积累的漏洞补丁转化为可用的漏洞利用程序;这意味着软件开发人员如今常用的典型补丁发布流程(每月发布一次,为期数周分阶段推出,预发布版和稳定版之间存在时间差)已经不再适用,这种流程建立在这样的假设之上,即将补丁“武器化”需要专家花费数周时间(而且能够做到这一点的专家数量有限);但“N日”的概念已经变得极具误导性,“N小时”更接近目前所处的实际情况。
Anthropic公司表示,从历史上看,N日漏洞对那些维护缓慢或难以修补的系统造成的危害最大。工业控制系统、医疗设备和“物联网”设备通常运行在固定的维护窗口期、固件由厂商锁定或有正常运行时间保证的环境下。随着利用漏洞攻击任何特定补丁的成本接近于零,这些设备和系统将变得更加脆弱。即使是那些按照既定的、“负责任的”补丁节奏运行的系统,现在也比以前更容易成为攻击目标。
Anthropic公司最强公开模型Claude Fable 5
Anthropic公司称,Fable 5是其迄今为止向公众发布的功能最强大的模型,在软件工程、科学研究、视觉识别和复杂知识工作任务等方面均超越了以往的Claude模型。Anthropic公司表示,随着任务规模和复杂性的增加,该模型的优势也日益凸显,使用户能够将规模更大的项目交给系统,同时减少监督和详细说明。
Anthropic公司表示,发布如此强大的模型也伴随着风险,如果没有安全措施,Fable 5在网络安全等领域的强大功能可能会被滥用,造成严重损害。因此,Anthropic公司在发布该模型时加入了安全措施,这意味着对某些主题的查询将由该公司功能次强的模型Claude Opus 4.8进行响应。为了安全快速地发布该模型,Anthropic公司对这些安全措施进行了保守的调整,这有时会误报一些无害的请求,但平均触发率不到 5%。
Anthropic公司称,Fable 5配备了一套全新的分类器:独立的AI系统,用于检测潜在的滥用行为,包括越狱尝试,并阻止主模型(即Fable 5)做出响应。当Fable 5的分类器检测到与网络安全、生物学、化学或蒸馏相关的请求时,响应将自动由Claude Opus 4.8处理。Anthropic公司对分类器进行了广泛的红队演练,以测试其抵御越狱的鲁棒性。除内部测试外,Anthropic公司还开展了外部漏洞赏金计划,在超过1000小时的测试中,没有发现任何通用越狱漏洞。

安全研究人员的早期测试表明,该模型的网络安全防护措施可能比Anthropic的描述更为全面。SANS研究所首席人工智能官兼首席研究员罗布·李表示,在他最初的测试中,他日常的网络安全任务(包括事件响应、检测和基本取证工作流程)被自动从Fable 5路由到Opus 4.8。如果这些观察结果在更广泛的测试中得到证实,则可能表明Anthropic的分类器能够广泛识别与网络安全相关的请求,而不是试图区分良性和恶意网络活动。
Fable 5的发布也重点关注软件工程领域,Anthropic认为该模型在该领域的优势尤为显著。在早期测试中,Stripe公司报告称,Fable 5将数月的工程量压缩到了几天之内。在一个拥有5000万行代码的Ruby代码库中,该模型仅用一天时间就完成了整个代码库的迁移,而这项工作如果由一个团队手动完成则需要两个多月。
Anthropic还表示,该模型在编码评估方面取得了最先进的成果,这些评估不仅衡量软件是否有效,还衡量软件是否符合生产环境中的预期标准。
该公司还重点强调了Fable 5在财务分析、文档推理、图表解读和视觉任务方面的提升。Anthropic公司表示,Fable 5能够准确地从复杂的科学图表中提取信息,并执行复杂的视觉推理任务,包括根据屏幕截图重建Web应用程序源代码。

全球最强模型Claude Mythos 5
Anthropic还面向一小部分网络安全防御者和基础设施提供商推出了Claude Mythos 5。该模型与Fable 5采用相同的底层模型,但在某些方面取消了安全防护措施。
Mythos 5将首先通过与美国政府合作的“玻璃之翼计划”(Project Glasswing)进行部署,作为 Claude Mythos预览版模型的升级版。该模型拥有全球所有模型中最强大的网络安全能力。Anthropic公司计划很快通过更广泛的可信访问计划来扩大Mythos 5的访问权限。
Anthropic公司称,在大多数情况下,Mythos 5的性能与Mythos预览版相当,甚至更胜一筹,而价格却大幅降低。
Anthropic公司称,Mythos 5拥有目前所有型号中最强大的网络安全能力。Anthropic此前曾强调Mythos系列系统能够发现软件漏洞、协助漏洞利用程序开发,并执行复杂的多阶段网络安全任务。
Mythos以及OpenAI公司的GPT-5.5-Cyber等类似模型,在最近几周促使特朗普政府和国会采取行动,以确保美国关键网络能够加强防御,并确保这些新兴的人工智能工具免受滥用。
声明:本文来自奇安网情局,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。