本文对固有后门进行了系统性研究,发现它们广泛存在于干净模型中,与注入型后门一样具有危险性,是一种新型攻击媒介。
我们设计了一种简单有效的攻击策略,利用辅助模型生成满足特定约束的注入文本,从而最大化KL散度。
通过本最佳实践,开发者能够在不同场景中使用不同的加固方法,从而有效地控制 LLM 行为并防止智能体面临的包括提示词泄露,有害内容输出,越狱等安全威胁。
围绕通用人工智能与超智能的发展前景、技术瓶颈及对齐问题展开探讨,指出当前人工智能模型在长期规划、因果推理等方面的局限性,并警示递归式自我改进可能带来的失控风险。
沙特在AI发展领域具有独特的价值,其国家发展战略也很有意思。这份AI智能体报告可以说是很先进的。
国内目前隐私计算的生态处于产业链各方正在寻求技术体系和应用体系协同的阶段。
眼下的境外势力究竟还有谁,渗透手段有哪些,我们又应该如何防范?谭主找到了相关专业人士,他们给出了一些线索。
本文收集整理了Black Hat 2023大会上备受关注的10款酷炫安全新品。
微信公众平台ICP代备案管理系统将提供新增备案、变更备案、注销备案等服务,协助开发者完成微信小程序备案。
创业卖域名,现在卖信息。这么多年了,58还是原地踏步。
成效分析。
美国前高官提出扩大私营部门参与进攻性网络行动的政策和法律考量框架。
本文展示了作为评判器的LLM在面对提示注入攻击时的脆弱性,并提出了JudgeDeceiver,一个基于优化的框架,能够自动生成注入序列,从而操纵作为评判器的LLM的选择。
GPT-5确实还是更科学一些。
研究员监测到大量来自南亚地区的APT组织针对我国科研院所开展定向窃密攻击,其中航空航天领域成为其攻击核心,国内有关科研单位和高校相继受到攻击。
梳理了APP及小程序备案相关的20个实务问题。
美国陆军网络部队认为人工智能未来将成为“战斗倍增器”。
高危漏洞软件风险自查清单 (ps:文末附必修高危漏洞列表)
本文将分享反手游欺诈相关的设计与探索。
本文通过数据安全治理6问,逐步深入展开探讨。
微信公众号