在公开数据集与实际网络流量数据上的测试结果表明,该方法能够有效识别多种威胁Web服务可用性的实体与攻击行为,具有较高的检测准确率和实际工程应用价值。
Agent Skill八类风险与三层防护架构。
前沿 AI 时代,安全不再只是模型外面的一层护栏,而是模型能否被社会接受、被监管允许、被企业长期使用的基础设施。
AI 越狱正在从语言空间进入物理空间。
EvoDefense 希望通过动态生成机制替代静态过滤,构建一套无需重新训练即可适应未知攻击和未知目标模型的防御体系,从而在实际部署中实现持久稳健的安全保障。
本文系统分析了智能体通信协议在不同环节所面临的数据安全与隐私风险,并评估了其对既有数据治理框架的影响,为智能体通信协议的安全设计、标准制定以及相关风险治理与解决...
当 Agentic AI 让高逼真欺骗可以规模化生产,安全的核心问题就不再是“如何识别谁是真的”,而是“如何限制一次交互能释放多少价值”。
行动风险更需重视。
企业 Agent 安全正在进入自己的检测响应时代。
当 AI 不再只是回答问题,而是开始执行任务,我们需要的不只是“允许/拒绝”,而是一套能够解释价值冲突的伦理坐标系。
随着AI越来越强,OpenAI准备如何管理风险,以及如何满足未来越来越严格的监管要求。
解读 Anthropic《Zero Trust for AI Agents》。
大模型在 SOC 分析人员手中被怎样使用?
FuzzingBrain V2 真正打动人的地方,不是某一个单点创新,而是它把一系列在各自领域已经被验证有效的思路,以工程化的方式拼成了一台完整的机器。
Underminr能够绕过绝大多数基于防护性 DNS 的安全控制,让恶意流量伪装成通往可信域名的正常通信,为网络攻击打开了一扇新的后门。
长期记忆、技能系统、MCP 工具链、文件系统和调度器,都会成为新的安全边界。
网站能否被动识别出AI Agent的底层模型?
发现容易修复难:AI网络安全能力提速下的新挑战。
Agent 安全的核心,不是让模型永远不犯错,而是让系统在模型犯错时仍然守住边界。
Anthropic公布了Project Glasswing的首月战报。
微信公众号