“ 2026年3月3日至4日,人工智能安全从业者大会([un]prompted 2026)在美国旧金山举办。会议聚焦人工智能系统的构建、攻击、防御以及战略治理,汇聚了全球顶尖的安全专家、研究者和从业者,设置构建安全的AI系统、攻击AI系统、利用AI进行进攻性安全研究等六个研讨方向,其中“利用AI赋能进攻性安全研究”方向聚焦如何把AI的智能化攻击能力转化为对防御方有用的知识,例如可验证的PoC、攻击流程、误报率控制等,围绕利用自主AI智能体挖掘与利用“Auth-by-One”复杂认证逻辑漏洞、AI驱动的规模化零日漏洞(0-Day)捕获等主要议题开展了讨论。”
议题一:AI Agents for Exploiting "Auth-by-One" Errors(利用自主AI智能体挖掘与利用“Auth-by-One”复杂认证逻辑漏洞)
演讲人:Brendan Dolan-Gavitt & Vincent Olesen——XBOW公司(自动化进攻性安全AI智能体领军企业)AI安全研究员
核心观点:传统的自动化漏洞扫描工具通常只能基于已知指纹(如CVE库)或基础语法错误(如SQL注入、XSS)进行检测,面对复杂的“业务逻辑漏洞”时往往无能为力。议题展示了如何利用自主智能体(Agentic AI)通过“感知-推理-行动”(Perception-Reasoning-Action)的循环,在复杂的多步交互中发现权限配置遗漏或条件竞争等逻辑缺陷。尤其是针对MCP(模型上下文协议)服务器和API调用的“Auth-by-One”这类微小的、极难被传统工具捕捉的越权漏洞,AI Agent能够自动拼接多个低危工具调用,最终实现越权数据窃取或指令下发。
延伸思考:在现代企业的微服务架构和零信任网络中,API接口成百上千。未来,黑客将不再手动抓包测试越权,而是直接投放“AI黑客智能体”。企业防御团队必须改变思路,不能仅依赖静态代码扫描(SAST)或Web应用防火墙(WAF),而需要引入同样级别的“AI红队”工具,在业务上线前让AI去攻击和验证,实现持续的动态对抗演练。
议题二:FENRIR:AI Hunting for AI Zero-Days at Scale (在海量规模下利用AI捕获AI系统自身的零日漏洞)
演讲人:Peter Girnus——趋势科技Zero Day Initiative (ZDI)的高级威胁研究员,ZDI是全球最大且最具影响力的厂商中立漏洞奖励与研究项目。
核心观点:该演讲揭示了AI如何彻底颠覆了漏洞发现的法则。Peter展示了FENRIR系统如何将原本需要顶尖安全专家耗费数月进行的人工代码审计工作,压缩至短短几个小时。这套系统不仅能对开源代码的差异(Diffs)进行自动化分类,还能精准识别具有高利用潜力的代码变更,并为模糊测试(Fuzzing)进行智能优先级排序。更具前瞻性的是,该演讲重点探讨了如何使用AI来大规模挖掘AI底层基础设施(如大模型运行环境、数据处理管道)本身的0-Day漏洞,这展示了AI在逆向工程和自动化漏洞利用中的恐怖潜力。
延伸思考:随着AI自动化编程的普及,程序员产出代码的速度翻倍,但同时也可能引入海量隐含漏洞。在攻防竞速中,攻击者正在利用AI工具对企业使用的开源组件(如各类依赖库)进行高频模糊测试。企业安全团队必须警惕“供应链投毒”和底层漏洞,传统的补丁管理速度已经跟不上AI挖洞的速度了,企业需加快部署基于AI的自动化修复架构。
议题三:Black-hat LLMs(黑帽大语言模型)
演讲人:Nicholas Carlini——Anthropic(Claude模型的开发公司)研究科学家,全球顶尖的对抗机器学习和AI安全领域的学术权威。
核心观点:Carlini探讨了当大语言模型被恶意攻击者通过地下数据集进行微调后,所诞生的“黑帽大模型”的破坏力。这些不受道德限制的大模型可以直接生成高级多态恶意软件(Polymorphic Malware),执行自动化的漏洞利用链(Exploit Chains),甚至针对企业高管的社交足迹生成完美伪装的深度网络钓鱼攻击。演讲直击当前AI安全在面对高级攻击者时的脆弱本质。
延伸思考:在社会工程学防御中,过去企业员工可以通过“拙劣的语法、机器翻译的痕迹”来识别钓鱼邮件。但在黑帽LLM的加持下,未来的网络钓鱼将是极度个性化的。AI可以模仿老板的口吻、引述昨天团队会议的内容来骗取员工凭证。因此,企业的终端安全防护必须从“识别已知恶意特征”升级为“基于身份行为基线的AI异常检测”,因为攻击载荷的产生已经完全实现了AI定制化。
总结
人工智能安全从业者大会“利用AI赋能进攻性安全研究”方向的讨论虽然聚焦进攻性安全研究,但其核心价值在于为防御体系提供新的技术路径和能力框架。大会所展示的AI驱动漏洞挖掘、自动化攻击模拟等技术,本质上为安全团队提供了更先进的安全测试与威胁发现工具。这些技术表明,网络安全正在进入以智能体为核心的自动化阶段:AI不仅能够模拟攻击者行为,也能够帮助防御方提前发现系统弱点,从而在真实攻击发生前完成风险修复。未来网络安全的核心竞争力,将不再只是人工经验,而是AI驱动的威胁发现能力、自动化防御能力以及安全数据与威胁情报的协同能力。
声明:本文来自网络安全卓越验证示范中心,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。