通过AI agent+通用大模型，实现海量告警研判分析实践

编者荐语

传统网络安全时代的安全运营，最主要的问题是安全设备有没有告警；AI 攻击时代，最主要的问题变成了告警太多来不及处理。AI 攻击带来的日志和告警急剧增加，过去甲方的告警降噪更多是由于自己的告警处理能力不足，只能是不断的对告警做优先级排序，把安全团队能够处理的告警处理掉，而由于安全团队的处理能力边界远小于自身面临的安全风险边界，导致很多安全风险和攻击并没有得到妥善处理，这也是安全事件层出不穷的原因。

AI 智能体加通用大模型技术目前已经具备了5-8 年安全分析师水平能力，并且还在不断快速迭代提升，通过 AI智能体建立数字安全员工来对抗 AI 攻击是完全可行的。过去我们招 1000 个乃至 10000 个安全员工来分析研判和处理告警不现实，但有了算力和智能体可以，从而提升安全处理能力，带来安全性提升。

算力即安全。

（一）引言

2026年4 月，Anthropic 通过 Project Glasswing 披露了一个尚未公开发布的通用前沿模型——Claude Mythos Preview。按官方说法，它的编码能力已经达到"在发现和利用软件漏洞上超过除最顶尖之外几乎所有人类"的水平：已发现数千个高危漏洞，覆盖每一个主流操作系统和浏览器，其中包括一个在 OpenBSD 里存活了二十七年、一个在 FFmpeg 里存活了十六年、扛过几十年人工审查的缺陷——而且大多是在没有人工引导的情况下自主完成的。英国 AI Security Institute 的独立评测也印证了这一点：专家级 CTF 通过率 73%，并第一次端到端完成了一个原本需要人类专家约二十小时、三十二步的企业网络攻击模拟。

当然，AISI也提醒，靶场和真实企业仍有差距——真实环境里有防御工具，也有在岗的防守人员。但比起争论某个模型到底有多强，更值得注意的是那个底层变化：

攻击侧的生产效率变了。
聂君

图 1：AI自动化攻击带来的防御崩溃

过去，一支高水平攻击队的能力，依赖少数顶尖专家、长时间积累、工具链和组织协作。现在，长程智能体正在把这些能力封装成可以反复调用的"agent-hour"——它不疲劳、不厌烦，可以一刻不停地连轴运行，对你的暴露面、弱配置、历史漏洞、凭据泄露、身份路径持续侦察和试探。

当攻击开始以机器速度、机器规模的指数演进，防守方本质上是堆设备、堆规则、堆人员的线性增长，攻击和防御方的效率会越拉越大。

企业安全团队长期面对一组令人窒息的数字：

指标	现实
平均每天告警数量	数千至数万条
告警误报率	高达 40%-60%
平均检测到响应时间（MTTR）	数小时到数天
全球安全人才缺口	约 340 万人

传统模式下，我们用“堆人”来应对“堆告警”。但人的注意力是有限的，疲劳、倦怠和流失率让 SOC 团队始终处于一种“慢性失血”的状态。

过去网络安全时代的安全运营，最主要的问题是安全设备有没有告警；

AI 攻击时代，最主要的问题变成了告警太多来不及处理。

0x1 攻防双方分析

1.1 AI 时代的攻击侧特点

特点一：攻击的边际成本正在归零

过去APT级的单点深度突破，只有少数组织负担得起。现在，一个模型自主运行一次，就能完成过去要专家二十小时的多步攻击，而且这种能力可以反复租用、按token计费。高级攻击从"少数组织的能力"变成"人人可租用的服务"，它的数量必然大幅上升——这是检测漏报、研判过载、处置过载三重压力的共同根源。

特点二：攻击只需单点成功，防御必须全面覆盖

攻击者天然是单点突破逻辑：一个暴露在公网的高危服务、一个弱口令、一个长期没修的漏洞、一个被钓中的员工，只要一个点成功，后面就是横向、提权、驻留、外传。防御则相反，要面对服务器、终端、账号、邮箱、业务系统、外发通道、云资源、供应链接口——任何一个点出问题都可能成为事件。

防御总成本，约等于资产数量乘以单资产的防御成本。攻击成本暴跌之后，如果防守方不能把"一次研判、一次调查、一条规则的维护、一次处置"的边际成本同样压到接近零，这道数学题就无解。

特点三：攻防变成了一场速度竞赛

攻击链智能体化之后，从落点到横向移动的突破时间，会从小时级压缩到分钟级，甚至秒级。而防守方的"检测—研判—处置"链路里，

只要任何一环还留给人工，整条链路就会退化为人工速度。

你检测做到秒级、研判做到分钟级，结果处置卡在"人工看完、人工确认、人工开工单、人工审批"上，那前面的快就白费了。

最后落到两个方向：压低防御的边际成本，用满防守方的结构性优势。

攻击者有强模型，防守方是不是更没法打了？不完全是。

1.2 AI 时代的防守侧特点

特点一：防守方有主场

企业有自己的资产、账号、日志、业务关系、历史行为和组织结构。攻击者的智能体进入环境时是盲的，每一步信息都要靠探测获取，而每一次探测，都是一次暴露机会。

特点二：防守方有平时

攻击发生时时间很紧，但攻击发生之前的全部时间，都属于防守方，而且没有时效约束。画像、基线、预案、盲区排查、狩猎、验证，都可以提前做。攻击者要花很久才能摸清的拓扑和权限关系，防守方的智能体本应在分钟级拿到——前提是这张图你平时就建好了。

特点三：防守方有历史

攻击者每次进来都要从零摸索；防守方手里有过去数月甚至数年的日志，知道一个员工、一台主机、一个账号、一条外发通道平时是什么样子。

特点四：跨客户的复利

攻击手法会复用、工具会复用、路径会复用。如果能把不同客户现场的经验沉淀成规则、画像维度、判例、狩猎假设和评测样本，就能形成攻击者结构上无法对抗的优势：攻击者一次只打一家，安全运营厂商从所有客户学习。

特点五：步数本身就是信号

这里还有一个反直觉、但很关键的点：攻击智能体的"步数"，本身就是信号。

自主探索意味着更多试探命令、更多失败重试、更多枚举动作。单步可以做得很隐蔽，但动作的绝对数量会大幅上升。对于平时就布好了传感器和诱饵的防守方，攻击者越勤快、跑得越久，触碰到信号点的概率就越高。

更强的攻击模型，对一个"地形已经布设好"的防守方，反而更有利。

所以面对层出不穷的新手法，真正稳健的检测思路，不是去追每一种变体，而是抓不变量——不识别"它用了什么新技术"，而是识别"这个实体不像它自己、不像它的同类"；攻击技术再快，总要侦察、总要提权、总要横移、总要外传，把检测锚在攻击链的咽喉上。

问题在于，这些都需要持续投入才能兑现，而"持续投入"恰恰是人力最匮乏、AI 防御智能体最擅长的部分。
聂君

0x2 解决思路

一个经典的安全运营架构包含四个框架：安全防护、安全运维、安全验证、安全度量。

图 2：安全运营框架

2.1 安全防护框架

由于计算机是分层的：网络层、虚拟化层、系统层、应用层、用户层、数据层、业务层，所以安全防护就是通过在每层上部署单点防御，构建一套纵深防御体系。

网络层做安全域划分和隔离等；
系统层安装防病毒和 HIDS等；
应用层有各类 XAST 和 WAF、漏扫等；
数据层部署各类 DLP、数据库审计、API 安全等；
业务层有反欺诈等。

这是过去 20 多年的安全基础建设领域，也是传统安全的主战场。

安全防护框架的主要产出是各类安全日志。
聂君

2.2 安全运维框架

安全防护框架产生的日志太多了，可达 20 万 EPS（events per second），一天是 172.8 亿日志量。甲方普遍做法是建设一套安全大数据平台（有的叫 SOC/SIEM），将这些原始日志统一收集起来，由于安全值班人员能处理的告警有限，甲方会在安全大数据平台上添加黑白名单规则（专业术语叫：UseCase）进行过滤，过滤后产生的告警，才是安全一二线人员每天真正处理的。由于一二线人员处理能力的限制，每个人每天处理的告警在 50 条左右，所以甲方通常处理的告警规模大概在几百到一二千条，通常在 500 条左右。

我们经常能听到一个词：告警降噪。甲方的告警降噪更多是由于自己的告警处理能力不足，只能是不断的对日志和告警做优先级排序，把安全团队能够处理的告警处理掉，而由于安全团队的处理能力边界远小于自身面临的安全风险边界，导致很多安全风险和攻击并没有得到妥善处理，这也是安全事件层出不穷的原因。所以：

500 条，不是团队面临的风险边界，而是团队的处理能力边界。甲方安全团队能力边界远小于自身面临的风险边界。
聂君

由于AI大语言模型的兴起，语义分析理解能力很强。AI 智能体加通用大模型技术目前已经具备了5-8 年安全分析师水平能力，并且还在不断快速迭代提升。

通过 AI智能体建立数字安全员工来对抗 AI 攻击是完全可行，也是当下破解困局的唯一思路。
聂君

过去我们招 1000 个乃至 10000 个安全员工来分析研判和处理告警不现实，但有了算力和智能体可以。提升安全告警处理能力，能够带来安全性提升，算力即安全。

传统的安全运营，误报率和漏报率是跷跷板的两端。但在 AI gent 安全运营方案中，可以同时实现误报率和漏报率的双降。

2.3 智能体建设方案

智能体队伍体系应该如何建设？2026 年的 Google Cloud Next，谷歌为安全运营提供的是四类智能体，包括告警分诊与调查、威胁狩猎、检测工程、第三方上下文增强；我们做“曜鉴”（见备注 1）时，最终落到的也是这四类，再加上智能复核的智能体。长期深入在一线做安全运营智能体的摸索实践，最后大家思路不谋而合。

备注1：“曜鉴”是笔者创立的知其安公司研发的 AI for Security 智能体平台，知其安另一个工具平台叫“离朱”安全有效性验证平台，超过一千家甲方用户使用该平台。

图 3：Google 内部安全团队构建的四类智能体

这四类智能体通过曜鉴叠在现有的态势感知平台之上，串成一条作业线（见下图）。态势感知平台原样保留，做第一轮聚合降噪；曜鉴叠在其上，由调度器做编排与预处理：把告警路由到对应智能体，按需回拉态势感知和设备里的数据、构建上下文；研判完，结论再写回态势感知。现有平台不变，只是后面接上一支随时在岗的智能深度研判队伍。

图 4：知其安曜鉴-安全智能体平台

其中：

告警分诊智能体：每条告警自动分诊、定性、给依据。这一段解决的是"量"；
智能复核智能体：分诊里判为高风险的，交给复核这一类二次确认——复核命中、建调查会话、深度分析、多源取证，必要时发起 IM 协查、接收人工反馈，最后给出结论。这一段解决的是"信"；
威胁狩猎智能体：不依赖告警触发，基于假设主动回溯存量数据，把潜伏威胁和历史漏报找回来；

检测工程智能体：把误报、漏报、新情报回流，自动迭代检测规则与智能体；
第三方上下文增强智能体：引入外部威胁情报和业务、资产上下文，供前面几类调用，让研判知内知外。

但五类智能体本身，并不等于一个可信的闭环。要让它成为闭环，关键在几件容易被忽略的事：研判结论要写回态势感知，研判过程要沉淀成防御资产和智能体记忆，人要在环上抽检；再加两道兜底：整条链路由持续验证盯着，不让它悄悄失效。可信、可控、可沉淀，再加上逐一验证——这就是"没有安全验证，就没有安全运营闭环"在智能体时代的样子。

AI Agent 的本质意义在于：它把安全运营从“人力密集型”推向“智力密集型”。初级分析师的重复性工作——告警分诊、日志查询、IOC 匹配——正是 Agent 最擅长的。

2.4 为什么是通用大模型

过去两年，安全行业一个奇怪的现象，是各家训练自己的安全垂域模型。曜鉴使用的是通用大模型。根因是智能体这套框架，对模型的要求变了。

在智能体里，能做到什么程度，很大程度上取决于背后模型的上限。模型越强，它自己规划调查、拓线、出错后自我纠正的余地就越大。这两年国内外都在往 Agentic SoC走，对模型的要求只会更高：综合推理要强、工具调用要稳。垂域模型在某个单点任务上也许能调出一点点优势，但在这种拼通用推理上限的场景里，很难跟上前沿通用模型的迭代速度。

垂域模型在安全领域效果不好，还有一个原因是安全领域训练数据量太小，质量不高。

至少到今天，在这种拼综合推理的场景里，我们还很少看到哪个安全垂域模型，能稳定达到头部开源SOTA通用大模型的水准。这是任务本身从"单点判得准不准"，变成了"能不能在一个开放问题里一步步推下去"。

模型的智能能力溢出，还得用在对的地方。 Agentic 框架下，更值得交给模型的，是那些不确定、要多步、要跨系统取证的活——比如较深的威胁狩猎、复杂告警的逐层研判。这类事情，没有哪条规则、哪个单一模型能一步给出结论，得一边调工具、一边补上下文，顺着线索往下走。

反过来，把前沿模型放到流量检测这种单点分类上，就没用在它的长处上。那一层要的是毫秒级在线判定，适合使用传统规则、特征；换上大模型，准确率的提升有限，却要多担推理时延和成本。业界对流量检测小模型的尝试更接近把传统 NDR/IDS 做一次 AI 化增强，仍是在单一数据面上做优化。模型真正用得上的地方，是去处理人一时想不清、规则又写不全的那部分。

用 AI 去做流量检测，本质上还是NTA安全设备+AI 功能，对 NTA 安全设备做一次升级换代，这和邮件安全+ AI 功能，主机安全+ AI功能等没有区别，还是安全建设设备厂商借用 AI 名义，再卖一次流量安全检测设备而已。

通过调研数十家金融和能源用户，AI for Security最好的应用场景是：代码安全、安全运营。

在安全运营领域，最好的应用场景是：通过 AI agent+ 通用大模型，对 SOC/SIEM 产生的告警（以及引起告警的原始日志）进行研判分析，提高日均告警处理能力。

甲方日均告警处理能力提升之后，开始拆白名单。很多安全事件是因为攻击者使用白名单通道干了黑名单的事情。
聂君

比如某股份制银行开始将自动化运维系统下发的任务和脚本，同步一份给 AI agent 复核，区分下发的自动化任务和脚本，是真正的生产运维的业务需要，还是自动化运维系统已被攻击队控制下发的是恶意脚本。

我以前在银行和安全公司工作负责内部安全防守时，均在内部攻防演习时被蓝军（红队）这么干过。

2.5 智能研判靠的是上下文工程，不是吞吐量

要让模型把"人想不清、规则写不全"的那部分处理好，光靠模型强还不够，还得让它在足够高质量的上下文里判。这是"模型之外"的另一面：上下文。研判准不准，关键不在一天过了多少条，而在判每一条时，手里的上下文够不够全、够不够准；而把上下文取全取准，要花时间、调接口、跨系统去查——这跟"求快、求量"本来就是两个方向。

流量检测大模型厂商，通常使用一个小而快的模型，把每天上百万条全过一遍，比的是处理量，从实践看来是靠不住的。

流量检测大模型的做法是海量告警先用快系统过一遍、做降噪和分类，它解决的是"量"，不是"信"，不能当成最终研判。一个小模型在上下文严重不足时一天判一百万条，这些结论很难直接采信，结果还是得靠人去抽检——想省的人力又回来了。

更致命的是，流量检测大模型能看到的信息有限，并没有跳出"凭有限信息下判断"这个老局限：和规则一样受制于"看到的太少"，躲不开漏报，也挡不住稍复杂、高级一点的攻击。而这些，正是我们一开始就想解决的问题。

研判要判得准，前提是提供足够高质量的上下文，至少有三类：

一是资产 CMDB，少了它，内对内的流量会大量误报。某头部券商现场，接入资产 CMDB 之后，智能体的研判准确率明显好转。一个常见的例子：NDR 按传统规则，会把 AI 代码开发工具的正常交互，报成 webshell上传；而智能体拿到资产信息、知道对端是一套代码辅助系统，就能认出这是业务流量，噪声随之降下来。

二是威胁情报，以及情报跟不上时的补位。内对外那类恶意外联，多数查一下情报就能定性，不必动用大模型；真正需要智能体的，是情报覆盖不到的地方。最典型的是钓鱼邮件——一个刚注册的钓鱼站点，威胁情报对这种新域名往往滞后。这时候只靠情报不够，得让智能体调 URL沙箱，把站点截图和页面内容取下来分析，再结合邮件正文的上下文，给出综合判断。

三是现场的值班知识，否则 AI 不了解内情也会判错。还有一类上下文不在任何系统里，只在值班人员的经验里：内部安全设备的拓扑、出口 IP、扫描器地址、企业里那些"不规范但其实正常"的业务习惯。这些得靠现场调研，整理成 AI 能用的研判知识。否则 AI不了解内情就会误判——一个看着"经常恶意外联"的源 IP，可能只是台 DNS 服务器；一个"频繁发起扫描"的源 IP，可能是公司自己的漏扫器。

资产、情报、现场知识，归根结底是同一件事：让模型在尽可能完整、准确的上下文里做判断。而这恰恰是"小模型刷量"给不到的。

这两年，业内也大致走到同一个判断上。从2025 年6月开始，上下文工程（Context Engineering）的提法开始流行——Karpathy 的说法是，在每一步给上下文窗口填进恰到好处的信息。

这也是我们选择通用大模型加 agentic 框架的原因：与其用一个小模型把上百万条都浅扫一遍，不如让一个足够智能的模型，在上下文取齐之后，把真正该深入调查研判的，判准、判透。

这些事指向同一个目标：泛化。安全运营最怕漏掉真实攻击，而漏报往往来自模型没见过的那种变体。垂直训练能让模型在某类样本上更顺手，但也容易把它的视野收窄；通用模型底子更宽，再配上尽量完整的上下文，模型对没见过的攻击才更可能反应过来。

2.6 对安全团队意味着什么

安全团队不会消失，但安全团队的结构会被深度重塑。

角色的重新定义

传统角色	未来演进方向
L1 分析师（告警分诊）	大部分工作被 Agent 替代
L2 分析师（深度调查）	转向 Agent 监督者 + 复杂场景处理
L3 / 威胁猎手	价值放大——专注于 Agent 无法处理的高级威胁
安全工程师	新增职责：Agent 策略设计、护栏配置、效果调优
CISO / 安全负责人	需要理解 AI Agent 的能力边界和风险

AI Agent 消灭的不是“安全岗位”，而是“重复性安全劳动”。 但如果一个团队 70% 的人力都花在重复性劳动上，那“消灭岗位”和“大规模重组”之间的距离，其实很近。

（二）落地实践

0x3 智能体实践：原理简单，区别在于工程化

文章：《安全验证，实现安全运营闭环实践》提到：飞机起飞的原理很简单，只要速度够快，机翼上下的压力差就能让它起飞；但真正造出飞机、建起整套航空体系，是极有门槛的工程。

安全智能体也是这样。让模型回答一条告警有没有风险，不难。让它在真实客户环境里长期、稳定、受控地参与安全运营，才是难的地方。

3.1 模型的三个限制

当前主流模型有三个限制：

第一，模型号称多模态，但它的多模态很有限。它能处理文本、图片、音视频，却做不到对eml 邮件、对 Word/PPT/Excel、对 PDF、对 zip/rar/7z 多层压缩、对嵌套 Office、对 pcap 流量包的"多模态"解析。这些全要靠工程化的预解析能力先喂给它。

第二，模型的预训练知识是"过期"的。它的知识可能停在去年某个月份，对网络安全里高频变化的资产数据、威胁情报、新上线的钓鱼URL、刚传到图床的钓鱼图片、员工邮件往来历史、某个资产近七天登录的 Top 来源，统统不了解。不接实时情报、不接资产、不接 URL 沙箱，它就只能靠"编"。

第三，模型的上下文窗口有限。我们做过一个很朴素的测试：用一个128K 上下文的国产开源模型研判 Webshell，一个 248KB 的文件就要消耗约 9 万 token。而真实场景里，一份超长的 DLP 外发文档可能十几万字，一个绕过用的大马可能超过 2MB，一千条暴力破解日志可能被聚合成一个告警。后来我们用滑动窗口分片、逐片摘要、累计风险分的方式做智能上下文压缩，才把一个 128K 模型能处理的文本量，从通常的 500KB 提到约 15MB，提升了三十倍。

这三个限制决定了：智能体的效果，七分在工程，三分在模型。以邮件安全场景为例：

三级压缩的附件没解全，结果把一封钓鱼邮件误判成了业务邮件；
解压密码藏在邮件正文的二维码里，识别不出来，解密失败；

附件其实没加密，但AI 从正文找到一个"假密码"后，就再也没尝试无密码直接解压；
邮件正文只引用了一张互联网图片，正文为空、图又下载不下来，于是误判；
压缩包里有exe，解压后没把目录树列给 AI 看——而在有些客户那里，附件带 exe 是要直接拦截的高危行为，AI 却因为拿不到目录结构而判错；
附件解密失败时，后端没把"解密失败"这个事实告诉 AI，AI 在信息不足的情况下，把它当成了业务邮件——正确的做法是判"信息不足"；
eml 里的 html 内容太长，模型直接不遵循指令、开始乱答，我们用 html2text 把无关内容裁掉才稳住；
员工用Word 里再嵌套一个 Word 来绕过 DLP 检测；
还有一个：员工外发被拦了好几次，最后把手机号第一位的数字"1"改成字母"l"，绕过了规则，发了出去。

这些坑指向同一件事：

在客户现场，决定AI研判成败的，往往不是模型聪不聪明，而是一个加密附件能不能解开、一段 html 要不要裁剪。

这正是当年"Top30失效点"的AI 版本——高级威胁，常常栽在低级问题上。

3.2 编排还是自主规划

在做主机安全告警的研判分析时，我们快速迭代了三个版本：

3.2.1 第一版，单条告警研判

输入一条告警，直接输出结论。简单直接，但缺上下文，误报很多——它根本不知道这台主机、这个账号平时什么样。

3.2.2 第二版，固定剧本调查上下文

我们让它先去查完整进程链、账号属性、异常登录、计划任务，再做判断。研判依据是丰富了，但调查步骤是固定的，本质上还是传统SOAR 剧本，一遇到复杂场景就不够用——因为真实的安全调查，常常是查完 A 才知道要不要查 B，第一次查询失败了还得改参数、换工具、换路径继续查。

3.2.3 第三版，基于Skill框架加调查 SOP 的自主规划

我们把HIDS、资产查询、日志检索这些能力封装成 Skill，让 AI 依据 SOP 自己制定调查计划、自己选择调用哪个工具、根据结果继续拓线、调用失败了自我修正。同一个工作流还能兼容不同版本的设备。这一版得到了几家头部客户的认可，可以覆盖暴力破解、异常登录等多种告警类型。

3.3 编排与自主长期并存

这三版的演进，回答了一个很多人纠结的问题：编排，还是自主规划？

我们的实践是：两者长期并存，按时效压力和任务性质分工。大量重复、流程固定的告警，用工作流编排类智能体做高吞吐初筛；少数高风险、不确定、需要多轮跨系统调查的告警，再交给 Agent 型智能体做深度调查。

为什么不能把所有告警都丢给最强的模型去深度分析？因为这在工程上不现实、在成本上不可持续、在SLA上也满足不了。一天约两万条告警，全量深度研判时，token 消耗高达约七亿；后来不得不把进入深度分析的告警量从两万压到三千，成本才降下来。

所以分层是必须的，而分层背后，缓存又不能设计的太粗暴。安全告警里，相似不等于相同：十条看起来很像的攻击，前九条可能都是扫描，第十条可能因为资产、路径、响应、时间线不同，就是真正的攻击成功。所以缓存要做精细：哪些能强复用结论，哪些只能复用中间证据，哪些必须重判。有些地方反而可以放心强缓存——比如某银行的客户经理经常把同一份授信报告模板外发给外部客户，文件哈希不变，就没必要每次都重新研判。

0x4 智能体实践：没有复核与协查，初筛就只是"看了一眼"

4.1 AI初筛存在不足

AI初筛有价值，它能在海量告警里先做降噪和分类。但如果到这里就结束，问题并没有解决。

举一个真实的数字。某客户近二十四小时聚合后的告警约一点七万条，其中被AI判定为"攻击成功"的，约一千六百条。表面上看 AI 已经很能干了，但这一千六百条如果还要运营人员逐条打开请求体、响应体、原始日志、资产信息去确认，那 AI 解决的只是"量"的问题，没有解决"信"的问题。

4.2 智能复核

智能复核是整套闭环里的一环，它做的事情，是在AI初筛之后，针对高风险、不确定、攻击成功这类告警，自动建一个独立的调查会话，由 Agent 型智能体去查资产、查情报、查 SOC 历史告警、查主机进程、查原始日志，把"模型的一个判断"变成"基于多源证据的复核结论"。

更关键的是一个设计理念：信息不足时，不要急着下结论。

很多安全告警，光靠日志是判不清的。最典型的就是账号异地登录——它可能是凭据泄露，也可能只是员工把账号借给了别人。这种情况，AI查遍了SOC、资产、情报也确认不了，那它就不该直接给出"攻击成功"或"攻击失败"的结论，而应该停下来找人。

4.3 人工协查与反馈闭环

我们的实践是让AI通过 IM 发起人工协查：把告警 ID、当前调查情况、需要确认的问题发到群里，人工带着告警 ID 回复、@ 一下机器人，系统通过回调把这条反馈写回对应的会话，AI 再接着完成复核。这里有个很现实的细节——群里可能同时有好几条协查请求，所以人工回复必须带告警 ID，否则系统不知道这是哪条告警的反馈。目前飞书、企业微信已经打通，钉钉在适配。这套机制在客户那里已经实战使用。

整个过程，系统会同时保留AI初筛原结论、智能复核结论、人工反馈、最终是否改判、改判依据。这才是闭环。

因为它打通了过去AI研判一直缺的那个东西——标准答案回路。过去每天都是新告警，AI 根本不知道自己昨天判对了还是判错了。有了复核和人工反馈，AI 才第一次拿到了"对错"的信号，才谈得上自我改进。

而且这些被确认过的案子，不该只是存进档案。更有用的做法，是把一整条过程沉淀成判例——这条告警当时长什么样、AI顺着什么路径查、查了哪些系统、最后结论是什么、人工和后验反馈又是什么。下次遇到相似的告警，调出来的是这整条"怎么查、怎么想"的过程，当作推理参考，而不是把当时那个"人工结论"直接套上去。

这两者差别很大：直接套用当时的结论，等于把判断退回到关键词匹配，系统也学不到任何东西；把完整判例当参考，AI借鉴的是当时的核查路径，再结合这次的差异重新判断。安全运营的经验，本就该一案一案积累成可被检索的范例，而不是指望谁在初次写提示词、建智能体的时候，就把所有情况一次想全、从此定型。

没有复核，AI只是给了你一个判断；有了复核与协查，AI才可能输出一个可解释、可追溯、可回放、可写回的运营结论。

0x5 智能体实践：让 AI 理解"这个实体平时什么样"

很多AI

研判效果不稳定，根源不在模型，而在上下文。
聂君

同样一条疑似敏感数据外发行为告警，研发部门外发代码和市场部门外发宣传材料，风险完全不同；同样一台机器主动外联境外IP，生产服务器和办公终端，判断标准也完全不同。这些信息在哪里？很多时候在人脑里、群聊里、工单备注里、Excel里，根源是没有结构化沉淀。AI 不知道，自然会误判。

5.1 实时画像

解决这个问题，不能靠继续写更长的提示词，也不能靠把所有历史日志一股脑塞给模型。靠的是结构化实体画像。

但我们在讨论里想清楚的一件事是：实体画像不应该是"提前给每个人、每个 IP 生成一份静态画像"。那是脚本批量算出来的静态结果，不会实时更新，用户一换时间范围、换筛选条件就失效了。

更合理的形态，是一套能按场景、按条件实时查询的上下文：同一类实体共用一套口径，按部门、时间、通道、风险状态去筛，而不是给每个人各存一张静态表。

这里有一点尤其要紧——人和AI 得看同一套事实。人在页面上看到的统计、AI 调查时拿到的上下文、报告里引用的数据，都得来自同一套查询逻辑；否则人一个口径、AI 一个口径，AI 给出的结论就既无法解释、也无法复盘。

那不是智能化，是新的混乱。

5.2 两个用途

画像有两个用途。第一个，是给AI研判提供上下文，让它不再只看单条告警。

第二个，把画像编译成检测能力。某台服务器过去九十天从不主动外联境外 IP，今天突然外联了；某个财务岗员工过去深夜外发的频次是零，今天出现了三次。这种"偏离了自身历史常态"的信号，往往比通用规则更有价值，而且不管攻击手法怎么变都成立。

5.3 分级治理

还有一点容易被忽略：挂在实体上的信息，性质并不一样，治理也得不一样。"这个IP是业务扫描器"、"这台主机是某业务的跳板机"是事实，要带出处和有效期；"这个员工深夜外发、上次人工确认是正常批处理"是判例，只能当研判的参考；真正要让某类行为"免研判"放行的，必须从画像里这种模糊记忆，晋升成一条可审计的白名单规则。记忆只负责提示，规则才负责放行，这条界限不能含糊。

把记忆挂在实体上还有个额外的好处——它能跟实体在现实里的生命周期联动。员工离职、主机改用途、系统下线，对应实体的画像就自动降权，注意是降权、不是删除：一条"他已经离职"的旧记忆，碰上"离职账号仍在登录"这种告警，反而是最关键的那把钥匙。

当然画像也有它的工程难点。它的查询频次可能远高于人——如果AI一天研判两千条告警，画像就可能一天被调两千次。所以底层得用更适合做聚合统计的存储引擎，配合缓存和限流，而不是简单堆在日志检索系统上。

0x6 智能体实践：检测阈值能压多低，取决于研判接得住多少

6.1 检测分三层

这里要先重构一个前提：检测不是一个环节，是三层。

我们习惯把检测当成秒级的在线判定——规则、模型、特征，毫秒级出结果。智能体进不了这一层，上下文窗口、推理时延、多轮调用的开销都不允许，这点没错。但检测还有第二层和第三层：第二层是离线的内容生产——写规则、调阈值、补盲区，按天计；第三层是阈值之下、被压掉、根本没进SOC的那批弱信号。智能体进不了第一层，却完全可以接管第二层、捞回第三层。

6.2 下移加分层

今天每家企业的告警阈值，本质上是按人工研判的处理能力标定的。人工团队的处理能力不够，就只能把阈值抬高、把弱信号压掉——而漏报，恰恰藏在被压掉的那部分里。当研判产能因为智能体变得弹性、单次调查的成本持续下降，最优阈值就会系统性下移：下游接得住了，就敢把更多弱信号放进来重新看。

当然，放进来不等于把这些弱信号都丢给最强的Agent深判——那又会回到老问题：深度调查很贵，不能全量上。得配合分层：新捞回来的弱信号，先用便宜的快系统和 AI 自己生产的规则去筛，只有真正可疑的才往上走。被压在阈值之下的灰色地带，也正是平时主动狩猎该去翻的地方。

所以把AI用在研判，会反过来改善检测的召回率。检测、研判、处置不是三段各自为政的流水线——研判这头接得住了，检测那头就敢把阈值压得更低。整条漏斗值得一起重新标定，而不是各自局部优化。

0x7 智能体实践：从消耗告警到生产防御资产

7.1 消耗VS复利

前面这些能力，最终都指向同一个判断。上一节AI自己生产检测规则、把检测阈值压低，就是这个判断的一个例子。

如果AI每天只是帮我们把更多告警看完，那么明天同样的告警还会再来，同样的误报还要再解释一遍。这不是复利，是消耗。AI 越强，账单越贵。

真正有价值的安全智能体，每完成一次调查，都应该留下一件"明天还在生效"的防御资产：

一条更准的检测规则、一条实体画像、一个可复用的判例、一个处置预案、一个狩猎假设、一个评测样本、一个带有效期的误报白名单、一个日志解析器、一个蜜标布设建议。
聂君

这些资产产出之后会持续生效、可以跨客户复制、可以被下一轮智能继续加工。防御的边际成本随资产存量复利下降，而攻击者的边际成本不变——两条成本曲线的剪刀差，才是防守方真正的胜负手。

攻击者的agent-hour产出一次性突破；防守者的 agent-hour 必须产出复利。

把"昂贵的深度智能"经济地铺到"海量资产的广度"上，无非几条路径：

把深度调查的成果固化为可复用资产，下次同类问题直接复用（摊销）；
便宜的快系统过滤、昂贵的慢系统聚焦，按风险分配调查预算（分层）；
用与攻击者同等的智能，先于攻击者找到并废掉单点缺陷（预先）；
跨客户、跨时间的知识网络，一处发现、全网获益（复利）；
防御能力本身要持续回归验证，否则会静默退化（验证）。

7.2 针对AI攻击者的诱饵

再举一个目前还少有人关注的方向：针对AI 攻击者的诱饵。攻击者自己也是LLM，就有 LLM 的弱点——它会系统性地读取环境里的文本：配置文件、文档、注释、历史命令。防守方可以在授权环境里布设专门面向 AI 攻击者的内容陷阱，诱导它去访问一个诱饵信标、暴露自己的行踪。这种手段对人类攻击者几乎不可见，对自动化攻击代理却命中率很高。这就是前面说的"步数即信号"——把攻击者最大的优势，变成防守方的信号源。

传统的SOC是一个告警处理工厂。AI 原生的 SOC，应该是一个防御资产工厂。告警只是原料，调查只是加工，真正的产出，是让明天的检测更准、研判更快、处置更稳、人工更少。

（三）展望

0x8 安全验证，在 AI 时代更重要了

8.1 新的失效点

之前写过一篇《安全验证，实现安全运营闭环实践》，总结下来就是：

没有安全验证，就没有安全运营闭环。

那篇文章的判断是：安全建设最怕的不是"没有设备"，而是"有设备，但不知道有没有效"。防火墙、WAF、NTA、HIDS、EDR、SOC，有没有？都有。有没有告警？也有。有没有效？不一定知道。所以要靠模拟攻击、收集结果、自动比对，把"应该拦截没拦截、应该告警没告警"的失效点找出来。

当我们把越来越多的判断、复核、处置交给AI 之后，安全验证比过去更重要。

因为防御体系会多出一批全新的、且更隐蔽的失效点：

日志源断了，AI不知道；
字段解析漂移了，AI在拿错误数据分析；
Skill 调用失败了，AI 没修正；
画像数据过期了，AI 拿到的是旧上下文；
模型升级之后，某类告警的误判率悄悄升高；
提示词改了一版，原来能识别的攻击识别不了了；
处置执行了，但没人验证它到底有没有生效。

AI时代的安全验证，不只是验证 WAF、NDR、HIDS 有没有告警，还要验证整条 AI 运营链路：告警有没有进来、字段有没有解析对、初筛有没有输出、复核有没有触发、Skill 有没有调成功、上下文有没有正确注入、协查有没有送达、结果有没有回写 SOC、处置后有没有验证。

8.2 指标陷阱

银行的运维同学通过模拟一笔转账交易，来判断网络、系统、应用、支付通道这一长串环节里有没有故障点——交易成功，说明全链路通；交易失败，说明存在一个或多个失效点。

AI安全运营也该这样：模拟一条攻击告警走完全程，如果最后没有得到预期的复核结论和处置动作，就说明这条AI 链路上存在失效点。

这里要特别警惕一个陷阱：指标陷阱。告警关闭率、研判覆盖率这种"效率指标"，单独看很容易作弊——把检测灵敏度调低，两个指标可以同时变好看。所以效率指标必须配一个能反映真实防御能力的指标对冲，比如用模拟攻击实测出来的检测验证通过率，这个数是没法靠调低灵敏度刷高的。

安全最怕的不是系统报错，而是系统不报错，但已经失效。
聂君

落到工程上，就是要有评测体系：维护覆盖eml、Office文档、pcap、Webshell 等各种格式的基线集，每次换模型、改提示词、调画像维度、加 Skill，都自动跑一遍回归，用 F1、准确率、召回率量化地比一比，确认能力是在变好，而不是偶尔看起来不错。市面上大多数通用智能体平台，连针对 eml、Office 文档这类非结构化文件的评测都没有，更别说多版本智能体的效果对比。

没有持续验证，就没有可信的AI安全运营闭环。

0x9 不做什么

9.1 不做的四件事

这里也想说清楚，AI 告警研判当前不做什么。

第一，我们不把AI 告警研判定位成"替代所有安全设备"的产品。

WAF、NDR、EDR、HIDS、DLP、邮件网关、SOC、资产平台、威胁情报，各有各的专业积累和数据入口。 AI 告警研判，更适合站在这些设备之后——目前已经对接了二十多类安全产品，从各家SOC、NGSOC、Splunk，到HIDS、威胁情报、URL 沙箱、各家邮件网关和 DLP——做跨设备、跨日志、跨实体、跨时间的二次研判与运营闭环。

第二，我们不主张把所有告警都交给长程Agent深度调查——前面那笔七亿 token 的账已经说明问题。

第三，不会轻易承诺"全自动处置"。在信任工程没到位之前，自动封禁、自动隔离不是智能运营，是自动闯祸。

第四，我们不认为把专家经验写进一段提示词就完事了。真正有价值的，是把专家经验软件化、结构化、可调用、可验证——变成标准Skill、狩猎模板、复核Playbook、画像维度和评测样本。

9.2 从环内到环上

最后，说说人的位置。

AI时代，安全人员会不会被取代？我的判断是：重复性的逐条研判岗位需求会大幅降低，甚至威胁狩猎（Threat Hunting）专家，俗称安全二线，也会被逐步替代，但真正懂安全运营的人会更重要。

过去人的位置在"环内"——每条告警都要看，每个结论都要复核，每个处置都要点一下。这条路走不下去了，因为只要人在每条告警的必经环节里，整条链路就是人工速度。

未来人的位置要迁到"环上"：做抽样审计，用统计的方式监督质量；做疑难仲裁，只处理模型低置信或异构复核有分歧的样本。

每一次人工纠正，都是最昂贵的训练信号，它必须自动进入评测集、判例库和智能体记忆，而不是消失在某条工单备注里。

这不是人的价值下降，而是人的价值从重复劳动，迁移到设定边界、监督质量、沉淀经验。

AI负责规模，人负责判断，系统负责闭环，验证负责信任。

（四）结语

前沿大模型让攻击变得更快、更便宜、更自动化，这是事实。但防守方的答案，不应该是再多堆几个值班人员，更不应该是买一个"AI 概念"就以为完成了升级。真正的答案，依然需要从实践中来。

这二十多年，大中型企业的安全建设大体到位，重心正从"建设"往"运营"上转。安全团队从一个处升格成安全运营中心，投入和重心跟着变。这几年的内生安全、安全左移、零信任，更多是理念上的更新，底层的安全建设技术其实已经走到成熟期。下一步，甲乙双方更多需要把安全运营做精做细。

但安全运营有两个老问题：一是没标准，一千个人心里有一千个安全运营；二是缺工具，事情主要靠堆人。而安全运营里大概八成是重复性的活，本该交给自动化——难就难在，怎么站在甲方的视角，做出真正贴合甲方需求的工具。

网络安全这行，绝大多数从业者是甲方企业里的安全团队，可这群人是"沉默的大多数"：他们每天在一线处理告警、修漏洞、做应急，最清楚运营缺什么，但这部分声音，市场上反而少有人听。大多数安全公司从产品功能去满足需求，上来就是八大功能、十大亮点；而不少公司的产品经理、方案专家，并没有多少甲方一线经验——有的连一个漏洞都没修过、一次事件都没处理过，就在指导甲方怎么做安全。这就像没带过孩子的人，来教你怎么带孩子。安全运营尤其吃这一点：它是把甲方的安全管理和体系流程化、把最佳实践沉淀下来，得结合一家企业的实际、风险偏好和容忍度，才能落地一套"架构 + 工具 + 流程 + 度量"的体系。

没有甲方安全实践经验，很难做出符合甲方需求的运营工具来。

知其安做的就是这件事——专注安全运营的工具链。从创业那天起，我们的目标就一个：用自动化和智能化，把安全运营的效率和产能提上去。这些年目标一直没有变。

第一个安全运营工具是离朱-安全验证平台。 2021 年起，我们在国内较早提出并推广"安全有效性验证"——用 7×24 小时持续模拟攻击，以攻促防，去检验一套防护体系到底有没有效。几年下来，积累了数万条攻击用例和一批攻防知识。

一个研判智能体能不能应对各类攻击、对没见过的攻击变体泛化得怎么样，正需要一套够全的攻击覆盖用例。

第二个安全运营工具是陆吾-内网安全资产运营平台，更好地维护动态资产数据，为安全运营智能体提供更高质量的内部上下文信息并持续动态更新；

第三个安全运营工具，就是曜鉴-AI 告警研判分析平台，从智能安全告警调查分析出发，持续嵌入更深的智能安全运营场景。2024 年 7 月开始，我们和某头部银行联合共建，把前面这些积累往智能体上应用，之后两年的主要节点，和业界时间线，大致是同步的：

走到这一步，我们的思路越来越清楚：真正要把曜鉴这类安全运营智能体，做成可落地、可复制、可规模化的产品，难的并不只是“让大模型回答一条告警有没有风险”。难的是在真实企业环境里，把安全能力的泛化、设备接入、上下文构建、实体画像、批量研判、缓存调度、评测验证、权限审计、沙箱隔离、跨会话记忆、模型推理性能这一长串都做扎实，最终搭成一整套可长期运行、可持续优化、可被验证、可被审计的智能体工程体系。业内 2026 年初给这件事起了个名字，叫Harness Engineering——就是前面那句“七分在工程”。

实践下来，这个方向最重要的几项能力是：把高质量的资产上下文维护好；对各类攻击有足够理解和更广的覆盖度，好让模型有更强的泛化、少漏真实攻击；把甲方一线的告警调查最佳实践沉淀下来，能在同业之间复制；以及不断提高安全运营的效率——从自动发现失效点，到自动积累上下文，到自动研判，再到人机协同。用更多的自动化，去抵消那些靠人容易出的疏漏：设备变更后防护悄悄失效、周末和夜班研判时的走神、引入 AI 之后信息不全导致的误判。

知其安团队核心成员，长期在甲方一线做安全——来自头部股份制银行、交易所、头部券商，也有来自大型互联网公司和上市安全企业的，从甲方安全实践视角发出发，广泛接触甲方真需求，用甲方实践思路工程化工具，真实解决问题，让安全创造价值。到今天，签约服务的客户超过250家，在六大国有银行、全国性股份制银行、城商行、交易所、券商、基金、保险等，能源、运营商、高端智能制造与互联网行业企业占有率超过 90%。

“知其安，知其所以安”。到了智能体时代，再加一条——还要知其所以智能：知道 AI 为什么这么判，知道智能体有哪些局限，知道怎么验证、如何复核、能否回滚、能不能持续变好。

参考来源

Anthropic. Project Glasswing. https://www.anthropic.com/glasswing
UK AI Security Institute. Our Evaluation of Claude Mythos Preview"s Cyber Capabilities.https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

声明：本文来自君哥的体历，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

通过AI agent+通用大模型，实现海量告警研判分析实践

角色的重新定义

深度剖析大模型驱动的开源软件供应链安全审计系统

网商银行API流量全链路可信防护体系演化与实践

智能守护，精准溯源：大模型赋能金融终端数据安全新实践