2026年3月24日,美国数据与AI独角兽Databricks在RSAC上正式发布Agentic SIEM产品Lakewatch。
在美国未上市科技公司中,Databricks的估值排名第五,仅次于OpenAI、SpaceX、Anthropic和xAI。Databricks也是全球估值第四高的AI独角兽。
AI攻击全面升级,传统SIEM陷入架构性困局
网络安全的攻防底层逻辑,已经发生了根本性的改变。过去以人工为主的攻防对抗,正在快速转向AI驱动的机器级对抗,安全行业迎来了前所未有的挑战。
大模型已在开源代码中发现超500个零日漏洞,AI Agent跻身漏洞赏金平台顶级黑客行列,APT也开始将AI武器化,实现入侵流程的全自动化。攻击者可以7×24小时不间断地构建漏洞利用方案、协同发起攻击,攻防节奏被彻底拉到了机器速度。

而与之相对的,是传统安全运营体系的结构性短板。传统SIEM产品依赖安全分析师手动丰富告警信息、人工编写检测规则、逐个验证威胁狩猎假设,整套流程往往需要数天甚至数周才能完成。这套模式在应对人工发起的攻击时尚且可用,但面对全天候、机器速度的AI攻击,架构本身就成了最大的防御瓶颈。来自ZeroDayClock的数据显示,漏洞利用的平均时间已从2025年的23.2天骤降至2026年的1.6天,攻防两端的响应速度差距被无限拉大。

更致命的问题来自数据层面。大型企业每天会产生TB级甚至PB级的安全数据,但传统SIEM普遍采用存算耦合的架构,每摄入一个字节的数据都会产生对应的成本开销。为了控制成本,企业不得不限制数据摄入、过滤数据、提前删除历史数据,甚至直接放弃聊天日志、音视频等多模态数据源的处理。
这就形成了攻防不对称:攻击者可以用AI Agent分析全量数据、寻找任意攻击面,而防御者只能看到自身数据的一小部分,天然存在检测盲区。同时,传统SIEM无法处理的多模态数据,恰恰是社交工程攻击、内部威胁、提示词注入攻击的核心藏匿点。
在Databricks看来,这早已不是单纯的成本或规模化问题,而是威胁形态与防御工具之间的架构不匹配。而这种架构瓶颈,与早年数据仓库面临的困境高度相似——昂贵的数据摄入、割裂的数据孤岛、有限的适用场景。最终,湖仓架构用开放格式、低成本存储、全数据类型支持完成了对数据仓库的颠覆,而现在,Databricks要把这套经过验证的范式,复制到安全运营领域。
Lakewatch:用湖仓原生架构,重塑安全运营
Lakewatch的核心定位,是将湖仓的经济学与架构体系带入安全运营,彻底重构传统SIEM的底层逻辑,其核心能力集中在三大维度。
全量数据统一治理,打破安全可见性壁垒
Lakewatch的底座,是Databricks的开放安全湖仓架构,让安全运营直接跑在企业已有的湖仓之上,彻底颠覆了传统安全工具需要单独复制、迁移数据的模式。
基于Unity Catalog统一治理能力,Lakewatch可以让企业的安全数据与HR系统、协作平台、应用日志、交易数据等全量业务数据放在同一环境中,实现统一的细粒度权限管控,支持表、行、列、属性级别的访问控制,同时保留全流程审计能力。当安全告警触发时,分析师可以瞬间跨所有数据源完成关联分析,无需切换工具、迁移数据,将威胁检测与封禁的时间从数天压缩到分钟级。

为了解决厂商锁定问题,Lakewatch拥抱开放标准:基于开放网络安全架构框架(OCSF) 构建,数据存储支持Delta Lake、Apache Iceberg、Parquet等主流开放格式,企业可以将数据存放在自己控制的AWS S3、ADLS、GCS等云对象存储中,跨任意云平台运行查询,真正实现数据所有权完全自主。同时,Lakeflow Connect组件可以实现主流安全数据源(AWS、Okta、Zscaler等)的自动化摄入与标准化处理,大幅降低数据接入的门槛。

以Agent对抗Agent:原生AI能力实现机器级攻防响应
面对AI驱动的自动化攻击,Lakewatch的核心解法是“用Agent对抗Agent”。和传统SIEM外挂式的AI功能不同,Lakewatch将AI能力原生嵌入到数据层,让防御AI Agent可以直接访问全量数据上下文,发挥最大效能。

Lakewatch的AI能力由Genie Agent承载,功能包括:
Genie Code:AI助手可以自动化完成新日志源的摄入与OCSF格式转换、基于最新威胁情报编写全新的检测规则、优化现有规则降低误报率、将自然语言问题转化为SQL查询语句,覆盖安全运营的核心自动化场景。
Genie Spaces:提供自然语言查询界面与Agent化运行框架,即便是不掌握专业查询语言的安全人员,也可以用日常语言完成复杂的多步骤威胁狩猎,大幅降低威胁分析的技术门槛。
除此之外,Lakewatch还提供检测即代码(Detection-as-Code)能力,支持用YAML定义检测规则,配合SQL查询或Python notebooks,可基于历史数据完成规则回测,并通过CI/CD流水线实现自动化部署;同时支持基于MLflow、Feature Store和Model Serving,直接在安全数据上训练和部署自定义机器学习模型,实现异常检测、行为分析、实体风险评分等进阶能力,搭配AI增强的可视化仪表盘,实现全流程的安全运营监控。

存算分离架构,实现PB 级规模的高效安全运维
Lakewatch沿用了湖仓架构核心的存算分离设计,彻底解决了传统SIEM存算耦合带来的成本痛点。企业可以将PB级的全保真安全遥测数据存放在自己的云存储中,仅在需要分析时按需调用计算资源,搭配Serverless无服务架构,无需管理任何基础设施,只为实际执行的查询付费。

这套架构带来的核心价值非常明确:企业安全运营成本最高可降低80%,同时可以保留数年的可热查询数据,而非传统方案的数周留存。既可以满足合规要求的长期数据留存,也可以支撑跨多年的历史数据威胁狩猎,无需为数据存储支付高额的license费用,实现成本的精细化管控与可预测性。
生态协同与技术加码,构建Agentic安全完整版图
为了强化Lakewatch的产品能力与生态覆盖,Databricks同步公布了三个动作,完成了从底层大模型、生态伙伴到核心技术的全链条布局。
首先是与Anthropic的战略合作深化。基于双方已有的合作基础,Claude将为Lakewatch提供核心的推理能力,支撑跨安全、IT、业务数据的信号关联与威胁挖掘;同时,Anthropic自身也已采用Databricks的安全湖仓方案,实现全量安全与业务数据的统一可见性,更早地发现潜在威胁。
其次是开放安全湖仓生态的正式启动。Databricks联合了Akamai、Palo Alto Networks、Zscaler、Okta、1Password、Deloitte等数十家安全厂商与服务合作伙伴,共同构建开放的安全生态,帮助企业实现遥测数据的自动化标准化处理,以统一的规模化能力应对现代化的AI攻击。
最后,Databricks宣布完成对Antimatter和SiftD.ai两家安全厂商的收购,为Lakewatch补齐技术能力。其中,Antimatter由加州大学伯克利分校的安全研究人员创立(Databricks也是加州大学伯克利分校团队创立),核心技术为AI Agent的可证明安全身份认证与授权体系;SiftD.ai则由Splunk搜索处理语言(SPL)的创造者、Splunk搜索栈的首席架构师创立,将为Lakewatch带来大规模检测工程与现代化威胁分析的技术积累。
参考资料:Databricks Announces Lakewatch: New Open, Agentic SIEM https://www.databricks.com/blog/databricks-announces-lakewatch-new-open-agentic-siem
声明:本文来自玄月调查小组,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。