Skill 市场的安全扫描器并不可靠。
AI 越狱正在从语言空间进入物理空间。
检测到风险,不等于阻止动作。
受此影响,Anthropic表示将立即禁用Fable 5和Mythos 5两款模型以确保合规,其他Anthropic模型的访问不受影响。
不到 5 秒就能破解。
技能作为智能体与外部世界交互的核心接口,也是相关安全风险的主要载体与放大器。因此,深入研究智能体技能所面临的安全威胁及其防护机制,对于有效化解新兴技术应用带来的...
把供应链攻击的扩散路径一层层堵住!
影子 AI 之所以值得重视,是因为它不是一个边缘问题。它很可能已经存在于大多数企业里,只是没有被系统性命名。
论文定义的攻击向量都能够在现实场景中被有效执行,当前主流LLM缺乏针对恶意MCP服务器的稳健防御机制,常见MCP客户端/Host也难以有效缓解相关攻击。
此次修订扩展了访问控制、网络分段、资产管理和供应链安全等核心要求,并与SP 800-171r3、SP 800-53r5及SP 800-160的相关内容保持深度衔接。
攻击者通过恶意网页触发漏洞,可绕过沙箱防护实现远程代码执行,完全控制用户设备。
通过用户授权协议嵌入应用的 "合法"SDK 代理模式,长期以来缺乏有效的监管与公众监督。正是这种模式支撑了 Bright Data 成为全球最大的住宅代理网络运营商,其公开宣称拥有...
通过分析梳理学术界在互联网应用欺骗误导行为治理规范方面的研究进展,明确互联网应用欺骗误导行为在数字治理语境下的内涵与表现形式,结合现实案例深入分析其对用户和社会...
Agent Skill八类风险与三层防护架构。
漏洞已被利用数月,在Meta修复AI客服漏洞之前,已有高价Instagram用户名已遭盗取并被转售。
前沿 AI 时代,安全不再只是模型外面的一层护栏,而是模型能否被社会接受、被监管允许、被企业长期使用的基础设施。
应对AI时代的挑战需要从三位一体的角度推动安全升级。
当 Agentic AI 让高逼真欺骗可以规模化生产,安全的核心问题就不再是“如何识别谁是真的”,而是“如何限制一次交互能释放多少价值”。
行动风险更需重视。
解读 Anthropic《Zero Trust for AI Agents》。
微信公众号