Databricks进军网安领域，推出Agentic SIEM产品Lakewatch

2026年3月24日，美国数据与AI独角兽Databricks在RSAC上正式发布Agentic SIEM产品Lakewatch。

在美国未上市科技公司中，Databricks的估值排名第五，仅次于OpenAI、SpaceX、Anthropic和xAI。Databricks也是全球估值第四高的AI独角兽。

AI攻击全面升级，传统SIEM陷入架构性困局

网络安全的攻防底层逻辑，已经发生了根本性的改变。过去以人工为主的攻防对抗，正在快速转向AI驱动的机器级对抗，安全行业迎来了前所未有的挑战。

大模型已在开源代码中发现超500个零日漏洞，AI Agent跻身漏洞赏金平台顶级黑客行列，APT也开始将AI武器化，实现入侵流程的全自动化。攻击者可以7×24小时不间断地构建漏洞利用方案、协同发起攻击，攻防节奏被彻底拉到了机器速度。

而与之相对的，是传统安全运营体系的结构性短板。传统SIEM产品依赖安全分析师手动丰富告警信息、人工编写检测规则、逐个验证威胁狩猎假设，整套流程往往需要数天甚至数周才能完成。这套模式在应对人工发起的攻击时尚且可用，但面对全天候、机器速度的AI攻击，架构本身就成了最大的防御瓶颈。来自ZeroDayClock的数据显示，漏洞利用的平均时间已从2025年的23.2天骤降至2026年的1.6天，攻防两端的响应速度差距被无限拉大。

更致命的问题来自数据层面。大型企业每天会产生TB级甚至PB级的安全数据，但传统SIEM普遍采用存算耦合的架构，每摄入一个字节的数据都会产生对应的成本开销。为了控制成本，企业不得不限制数据摄入、过滤数据、提前删除历史数据，甚至直接放弃聊天日志、音视频等多模态数据源的处理。

这就形成了攻防不对称：攻击者可以用AI Agent分析全量数据、寻找任意攻击面，而防御者只能看到自身数据的一小部分，天然存在检测盲区。同时，传统SIEM无法处理的多模态数据，恰恰是社交工程攻击、内部威胁、提示词注入攻击的核心藏匿点。

在Databricks看来，这早已不是单纯的成本或规模化问题，而是威胁形态与防御工具之间的架构不匹配。而这种架构瓶颈，与早年数据仓库面临的困境高度相似——昂贵的数据摄入、割裂的数据孤岛、有限的适用场景。最终，湖仓架构用开放格式、低成本存储、全数据类型支持完成了对数据仓库的颠覆，而现在，Databricks要把这套经过验证的范式，复制到安全运营领域。

Lakewatch：用湖仓原生架构，重塑安全运营

Lakewatch的核心定位，是将湖仓的经济学与架构体系带入安全运营，彻底重构传统SIEM的底层逻辑，其核心能力集中在三大维度。

全量数据统一治理，打破安全可见性壁垒

Lakewatch的底座，是Databricks的开放安全湖仓架构，让安全运营直接跑在企业已有的湖仓之上，彻底颠覆了传统安全工具需要单独复制、迁移数据的模式。

基于Unity Catalog统一治理能力，Lakewatch可以让企业的安全数据与HR系统、协作平台、应用日志、交易数据等全量业务数据放在同一环境中，实现统一的细粒度权限管控，支持表、行、列、属性级别的访问控制，同时保留全流程审计能力。当安全告警触发时，分析师可以瞬间跨所有数据源完成关联分析，无需切换工具、迁移数据，将威胁检测与封禁的时间从数天压缩到分钟级。

为了解决厂商锁定问题，Lakewatch拥抱开放标准：基于开放网络安全架构框架（OCSF） 构建，数据存储支持Delta Lake、Apache Iceberg、Parquet等主流开放格式，企业可以将数据存放在自己控制的AWS S3、ADLS、GCS等云对象存储中，跨任意云平台运行查询，真正实现数据所有权完全自主。同时，Lakeflow Connect组件可以实现主流安全数据源（AWS、Okta、Zscaler等）的自动化摄入与标准化处理，大幅降低数据接入的门槛。

以Agent对抗Agent：原生AI能力实现机器级攻防响应

面对AI驱动的自动化攻击，Lakewatch的核心解法是“用Agent对抗Agent”。和传统SIEM外挂式的AI功能不同，Lakewatch将AI能力原生嵌入到数据层，让防御AI Agent可以直接访问全量数据上下文，发挥最大效能。

Lakewatch的AI能力由Genie Agent承载，功能包括：

Genie Code：AI助手可以自动化完成新日志源的摄入与OCSF格式转换、基于最新威胁情报编写全新的检测规则、优化现有规则降低误报率、将自然语言问题转化为SQL查询语句，覆盖安全运营的核心自动化场景。
Genie Spaces：提供自然语言查询界面与Agent化运行框架，即便是不掌握专业查询语言的安全人员，也可以用日常语言完成复杂的多步骤威胁狩猎，大幅降低威胁分析的技术门槛。

除此之外，Lakewatch还提供检测即代码（Detection-as-Code）能力，支持用YAML定义检测规则，配合SQL查询或Python notebooks，可基于历史数据完成规则回测，并通过CI/CD流水线实现自动化部署；同时支持基于MLflow、Feature Store和Model Serving，直接在安全数据上训练和部署自定义机器学习模型，实现异常检测、行为分析、实体风险评分等进阶能力，搭配AI增强的可视化仪表盘，实现全流程的安全运营监控。

存算分离架构，实现PB 级规模的高效安全运维

Lakewatch沿用了湖仓架构核心的存算分离设计，彻底解决了传统SIEM存算耦合带来的成本痛点。企业可以将PB级的全保真安全遥测数据存放在自己的云存储中，仅在需要分析时按需调用计算资源，搭配Serverless无服务架构，无需管理任何基础设施，只为实际执行的查询付费。

这套架构带来的核心价值非常明确：企业安全运营成本最高可降低80%，同时可以保留数年的可热查询数据，而非传统方案的数周留存。既可以满足合规要求的长期数据留存，也可以支撑跨多年的历史数据威胁狩猎，无需为数据存储支付高额的license费用，实现成本的精细化管控与可预测性。

生态协同与技术加码，构建Agentic安全完整版图

为了强化Lakewatch的产品能力与生态覆盖，Databricks同步公布了三个动作，完成了从底层大模型、生态伙伴到核心技术的全链条布局。

首先是与Anthropic的战略合作深化。基于双方已有的合作基础，Claude将为Lakewatch提供核心的推理能力，支撑跨安全、IT、业务数据的信号关联与威胁挖掘；同时，Anthropic自身也已采用Databricks的安全湖仓方案，实现全量安全与业务数据的统一可见性，更早地发现潜在威胁。

其次是开放安全湖仓生态的正式启动。Databricks联合了Akamai、Palo Alto Networks、Zscaler、Okta、1Password、Deloitte等数十家安全厂商与服务合作伙伴，共同构建开放的安全生态，帮助企业实现遥测数据的自动化标准化处理，以统一的规模化能力应对现代化的AI攻击。

最后，Databricks宣布完成对Antimatter和SiftD.ai两家安全厂商的收购，为Lakewatch补齐技术能力。其中，Antimatter由加州大学伯克利分校的安全研究人员创立（Databricks也是加州大学伯克利分校团队创立），核心技术为AI Agent的可证明安全身份认证与授权体系；SiftD.ai则由Splunk搜索处理语言（SPL）的创造者、Splunk搜索栈的首席架构师创立，将为Lakewatch带来大规模检测工程与现代化威胁分析的技术积累。

参考资料:Databricks Announces Lakewatch: New Open, Agentic SIEM https://www.databricks.com/blog/databricks-announces-lakewatch-new-open-agentic-siem

声明：本文来自玄月调查小组，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。