本文展示了作为评判器的LLM在面对提示注入攻击时的脆弱性,并提出了JudgeDeceiver,一个基于优化的框架,能够自动生成注入序列,从而操纵作为评判器的LLM的选择。
申请禁止使用用户数据训练人工智能模型的临时禁令申请被法院驳回!
本研究以中国海油为样本,提出“多维协同驱动”的网络安全教育体系创新框架。研究成果不仅为能源行业提供系统性解决方案,更通过教育生态与生产网络的深度耦合,形成立体化的...
股东名册能不能删除?
一些闲置的“电子家当”留着无用出手置换,其中的风险隐患您又是否全然了解?
攻击者给文档注入恶意提示,误导ChatGPT。
天津、北京、海南、上海、浙江等地相继制定并发布自贸试验区数据出境负面清单,涵盖汽车、医药、零售、民航、再保险、深海业、种业等17个领域,旨在为相关数据跨境流动提供...
报告指出,通用人工智能的发展或将重塑全球权力格局,并将中美战略竞争推向新阶段,尤其可能在颠覆性武器、权力体系变革、杀伤性武器扩散、智能体失控及国家局势不稳定五大...
通过本最佳实践,开发者能够在不同场景中使用不同的加固方法,从而有效地控制 LLM 行为并防止智能体面临的包括提示词泄露,有害内容输出,越狱等安全威胁。
G7峰会《AI促进繁荣宣言》撕去“安全”标签,宣告西方政策重大转向:从防范AI失控风险,全面倒向经济竞速赛道。地缘博弈、千亿产业游说、军备焦虑与ChatGPT成功叙事,合力构...
伊朗网络行动已从孤立的报复性攻击转变为多维度、协调一致的战略行动,显示其网络认知战战略演进进入了新阶段,也为未来网络认知战的发展提供了借鉴。
本文旨在系统梳理欧盟《人工智能法案》的最新实施动态,并介绍关键指南文件的核心内容。通过分析法案的落地进程,我们希望帮助企业更好地把握欧盟人工智能监管方向和实施要...
2025年上半年,APP监管趋严,专项行动开展后已有超642个APP/SDK被通报。本文旨在梳理现行监管体系,明确APP运营者的合规“红线”,并提供适当的应对策略。
结合通用大模型评估维度和网络安全领域的特殊性,尝试探讨针对网络安全垂直领域大模型应用的测试指标体系的构建。
《报告》分为三个核心章节:安全意识计划基准比对、安全意识计划成熟度、安全意识专业人员职业发展。
玩转鸿蒙调试工具HDC(HarmonyOS Device Connector)工具、aa工具(Ability助手)、bm工具(Bundle Manager包管理工具)与hilog工具。
沙特在AI发展领域具有独特的价值,其国家发展战略也很有意思。这份AI智能体报告可以说是很先进的。
美国政府对芯片出口“抽成”的做法,已在美国国内引发广泛争议,被指可能开创“以费换证”的先例,挑战传统出口管制政策。
介绍了主要国家及组织的人工智能监管及其对国防与国家安全领域的影响,并指出国防与国家安全领域需采取举措以应对潜在影响。
美国防部AIxCC决赛提晓最佳漏洞识别和修复AI模型。
微信公众号