AI浏览器将是发病重灾区。
论文系统论证了推理能力对模型泛化、效率与实际威胁识别的重要作用,并首次验证了“专用小模型,优于通用大模型”在安全领域的成立性。
OpenAI透露,旗下前沿大模型的网络攻防能力正在快速提升,在CTF比赛中,8月GPT-5仅得分27%,11月GPT-5.1-Codex-Max达到了76%,预计未来发布的前沿模型都将达到高级别网络安...
该框架旨在绘制并量化真实工作流中的智能体风险。除了提出新的风险分类法和动态评估方法,还详细剖析了NVIDIA AI-Q Research Assistant的案例,并开源了一个包含超过一万条...
提出了 NetMatrix,这是一种新颖的表格表示形式,它利用 RFC 规范来捕捉网络流量的有意义特征。
本文首次系统分析了了威胁情报黑名单的操纵风险,这会破坏服务器之间的正常通信,甚至导致受害者域名被注册局删除。
这一研究不仅揭示了人工智能、社交媒体和人形机器人等新兴技术在认知攻击中潜藏的风险,也为各国构建跨学科、具有前瞻性的信息安全体系提供了启示。
作者旨在通过标准化、可复现的实验设计,构建跨多模型的代码安全量化评估框架,为社区理解LLM自动编程的安全现状、识别风险模式、推动更安全的AI开发助手奠定数据与实证基...
当下的挑战主要集中于语义复杂度失控:工程师缺少必要的工程手段来预测、设计并约束系统的行为。
隐私安全、财产安全,在新一代人机交互入口中的攻防博弈。
本文针对文本后门攻击中最难防御的句法后门,提出了 SynGuard 防御框架。
提出了一种双模态对抗提示攻击。
通过系统性的实验和案例,论文力图为红队攻防进入“AI自治与智能化”的新时代提供理论支撑与实现路径。
在多智能体框架中引入RAG模块对任务执行成功率的提升起到了关键作用,且显著优化了任务执行过程中的生成相关性和准确性。
文章提出了一种新颖的政策优化框架——VULPO(Vulnerability-Adaptive Policy Optimization),这是首个专为上下文感知漏洞检测设计的基于on-policy RL的LLM优化方法。
本文从红蓝对抗的角度出发,通过模拟红蓝对抗中的红队(攻击者),帮助大模型智能体开发者理解恶意MCP工具对其系统的潜在影响,并促进下一代支持MCP且具备攻击防御能力的大...
ForgeDAN的核心贡献在于提出了一套兼具有效性、泛化性与稳定性的黑盒越狱生成框架。
本文探索了LLM应用开发实践中的风险,剖析了在新的开发范式下,LLM应用面临的潜在新风险点。
披露 IOC 的时候,到底攻击者还用不用?不再使用时也就无法起到威慑作用,保护用户的作用也被削弱。
依赖 IOC 的被动事件回溯,需要存储多长时间的日志呢?
微信公众号