OpenAI发布专用于安全的大模型GPT-5.5-Cyber。
}网络威胁情报团队DarkAtlas提出基于活动的APT归因框架。
高自主Agent的五阶段生命周期与五层防护框架。
该体系核心思路是为大模型嵌入一套资深安全专家的标准化工作流框架,让审计流程从“AI无序盲审”进化到“多智能体编排协同作战”。
安全行业,又被新闻学坑了!
当 Agent 开始自己花钱、签约和交易,AI 安全就不再只是内容安全,而是一步步走向资产安全、交易安全,甚至市场安全。
本文从发展态势出发,梳理智算中心跨域训练、边缘推理与任播分发、AI驱动路由运维、路由安全协同四大典型场景如何重塑域间路由的技术路径,并从技术、运维、安全、治理四个...
本文系统梳理Hermes在接入、推理、执行、沉淀四个层面相较于OpenClaw的安全改进,同时揭示其自主进化能力背后暗藏的四类结构性风险,并从接入权限管控、记忆文件保护、审批...
本文围绕仅用极少量样本完成训练这一目标展开,提出tFusion,将网络流量同时看作包级、流级和主机级多粒度信息的组合,并试图通过跨模态特征融合提升有限样本条件下的检测...
Agent 在不可信网页环境里工作时,安全判断最好拥有一条独立通道,并且这条通道要接入动作执行前的决策点。
聚焦训练与推理两个阶段的泄露风险开展大模型隐私保护研究,为构建全链路隐私保护体系提供解决方案,保障数据处理的合规性与安全性。
instant software。
OpenAI 发布开源权重的 Privacy Filter 模型,一款专为敏感信息检测与脱敏设计的模型。
长上下文、低成本、开源、工具调用和沙箱基础设施,会把 AI 安全问题推向真实工程系统。
引入大模型“以技术管技术”,成为治理AI谣言的新探索。本研究聚焦于借助大模型治理AI谣言的策略、技术推广过程中存在的问题,以及相应的改进建议展开深入分析。
针对多智能体系统的风险特性,安全防护需从“被动应对”转向“主动分层防御”,并同时总结形成指引性规范。
提示注入安全改写防御的问题,不是“怎样把输入洗得更干净”,而是“在边界不可消失的前提下,怎样让系统仍然可控”。
研究通过一套模拟真实渗透场景的功能性实验,验证了 RedShell 生成的 PowerShell 载荷在受控环境中的实际可执行性与攻击有效性。
Agent 的安全边界,正在从“当前这轮 prompt”转移到“它长期保存并持续信任的状态”。
提示注入不是一个单点问题,而是一组绕过机制完全不同的攻击集合。
微信公众号