ESET发现一个正在开发阶段的新型勒索软件PromptLock,其恶意行为代码由一个私有部署的大模型动态生成,预计未来有可能根据失陷环境量身定制攻击代码。
一套符合MECE原则、分类收敛、兼容工业界事实的恶意代码分类框架。
本论文围绕协议模糊测试的深层智能化难题,提出了MultiFuzz这一基于密集检索和多智能体协作的创新性架构。
文章提出了一种基于文本的异常检测方法 FALL,用于 HPC 系统的提前故障检测。
新加坡研究团队对5G网络进行安全研究,推出了首个无需伪造基站的5G通信流量实时嗅探框架,并展示了一系列基于该框架的攻击手法,如设备指纹识别、拒绝服务、网络降级等。
实验显示,MCP-Guard在多项指标上显著优于当前主流MCP安全基线系统,兼具高召回、低延迟和良好的易部署性,为真实环境下LLM-工具生态的安全落地提供了切实可行的解决方案。
文章提出了该工作提出可认证鲁棒性框架,为AI流量分析提供对抗攻击下的安全保障,并结合异常检测提升实用性。
本文介绍WACV论文《Improving Fairness in Deepfake Detection》,提出DAG-FDD与DAW-FDD两种基于CVaR的公平性优化方法,在提升深度伪造检测公平性的同时保持检测性能。
本文展示了作为评判器的LLM在面对提示注入攻击时的脆弱性,并提出了JudgeDeceiver,一个基于优化的框架,能够自动生成注入序列,从而操纵作为评判器的LLM的选择。
基于大语言模型的解决方案虽灵敏度更高,但会产生较多误报结果,其适用于开发过程,可助力系统开发人员及时察觉潜在缺陷。
GPT-5遭回声室与叙事攻击破解。
从TCP/IP 层到应用层的指纹识别。
本研究特别关注在SFT过程中,数学推理、代码生成和通用人类对齐能力这三者之间数据构成的相互作用。
在真实用户流量的统计中,gpt-5-main的“含重大事实错误的回答”比例比GPT-4o减少45%,gpt-5-thinking则比o3减少78%。
Project Ire系统通过调用API,整合多种逆向工程工具,从底层二进制分析、控制流重构乃至代码行为等角度不断更新对目标文件的理解,从而实现对测试数据集漏报率约一成、误报...
系统性揭示并量化了persona prompt在大语言模型安全对抗中的关键作用,提出了创新性的基于遗传算法的自动进化框架,实现对高效攻击型persona prompt的自动发现与优化。
本文的实验部分主要关注三个重点:流量分类任务、协议理解任务和消融实验。
本文提出了一种名为MH-Net的新型多视角异构图模型,通过将不同位数的流量比特聚合为多种类型的流量单元,构建多视角流量图,丰富了信息表达粒度,并提升了模型性能。
第七届“纵横”网络空间安全创新论坛评选发布。
微信公众号