本文展示了作为评判器的LLM在面对提示注入攻击时的脆弱性,并提出了JudgeDeceiver,一个基于优化的框架,能够自动生成注入序列,从而操纵作为评判器的LLM的选择。
G7峰会《AI促进繁荣宣言》撕去“安全”标签,宣告西方政策重大转向:从防范AI失控风险,全面倒向经济竞速赛道。地缘博弈、千亿产业游说、军备焦虑与ChatGPT成功叙事,合力构...
本文旨在系统梳理欧盟《人工智能法案》的最新实施动态,并介绍关键指南文件的核心内容。通过分析法案的落地进程,我们希望帮助企业更好地把握欧盟人工智能监管方向和实施要...
股东名册能不能删除?
“智能体互联网”成为下一代互联网的最大热点,算网融合走向协议创新的深水区,网络安全仍是全球关注的重头戏。
疑似涉及多州、多法院,潜在暴露密封起诉书、尚未执行的逮捕/搜查令,以及协作被告与保密线人的敏感身份信息。
期间监测处置网络安全威胁7.7万余个,清除移动互联网恶意程序9200余个,封堵恶意域名、IP地址190个。
特朗普政府推出的人工智能战略文件体系呈现出“一总三分” 的鲜明结构,即一份统领性的战略计划与三项针对性的行政命令形成有机整体,共同服务于 “确保美国在人工智能领域长...
民生银行开展了“大模型安全风险管理及应用评估能力体系建设”项目研究,旨在加强金融行业大模型应用的安全性和合规性保障,提升大模型安全风险应对能力。
这也泄密?嗯!
围绕通用人工智能与超智能的发展前景、技术瓶颈及对齐问题展开探讨,指出当前人工智能模型在长期规划、因果推理等方面的局限性,并警示递归式自我改进可能带来的失控风险。
结合通用大模型评估维度和网络安全领域的特殊性,尝试探讨针对网络安全垂直领域大模型应用的测试指标体系的构建。
泄露数据包含员工设备轨迹、工控系统漏洞详情及安防警报,使黑客可精准设计渗透电网核心、甚至物理破坏关键设施的方案。
两名直接知情人士透露,此举旨在监控受美国出口限制的AI芯片是否被转移至中国,仅针对特定调查中的货物实施。
攻击者给文档注入恶意提示,误导ChatGPT。
面向全海军部确立了针对“使用容器化技术”(containerization technology usage)的新政策。
南昌市网信办依法对某医疗机构作出行政处罚。
结合历史案例与技术现状,分析人工通用智能技术引发的国家安全问题及潜在后果,并探讨当前美国人工智能战略的局限性及未来发展方向。
武汉地震监测中心被网攻“幕后黑手”已锁定,美国神秘侦察系统即将被曝光。
基于安全大数据和人工智能的信息安全运营与态势感知系统,可从全局上提高对安全威胁的感知、理解和处理能力,同时根据运营反馈结果,使得网络安全管理人员更加合理的调整,...
微信公众号