那个“看似有意识”的 AI 正在到来。
文章提出了该工作提出可认证鲁棒性框架,为AI流量分析提供对抗攻击下的安全保障,并结合异常检测提升实用性。
美国前高官提出扩大私营部门参与进攻性网络行动的政策和法律考量框架。
报告界定了人工智能失控(LOC)的定义及其潜在场景,并针对性地提出了加强预防和应对措施的建议。
这份联合指南《OT网络安全基础:资产清单指南(针对所有者和运营商)》是OT所有者和运营商在日益复杂的网络威胁环境中加强OT环境网络安全态势的综合蓝图。
报告指出,通用人工智能的发展或将重塑全球权力格局,并将中美战略竞争推向新阶段,尤其可能在颠覆性武器、权力体系变革、杀伤性武器扩散、智能体失控及国家局势不稳定五大...
通过本最佳实践,开发者能够在不同场景中使用不同的加固方法,从而有效地控制 LLM 行为并防止智能体面临的包括提示词泄露,有害内容输出,越狱等安全威胁。
围绕通用人工智能与超智能的发展前景、技术瓶颈及对齐问题展开探讨,指出当前人工智能模型在长期规划、因果推理等方面的局限性,并警示递归式自我改进可能带来的失控风险。
申请禁止使用用户数据训练人工智能模型的临时禁令申请被法院驳回!
2025年上半年,APP监管趋严,专项行动开展后已有超642个APP/SDK被通报。本文旨在梳理现行监管体系,明确APP运营者的合规“红线”,并提供适当的应对策略。
行业讨论应用安全的方式与我们日常实践之间存在着持久的脱节。
在数据要素加速成为驱动经济增长新引擎的时代背景下,构建安全、高效、可信的数据流通共享环境已成为激发数据潜能的关键基石。
当Grok用户点击“分享”按钮时,会生成一个唯一网址用于分享对话,但这个网址同时也会被提供给谷歌、必应等搜索引擎,导致对话内容可被任何人搜索到。
主要介绍了开源情报目前在俄罗斯国内的发展现状,俄罗斯社会对于开源情报的认知和理解,包括目前开源情报发展涉及俄罗斯法律和道德伦理的方面。在此基础上,作者针对俄开源...
软件密集型系统通常会生成控制台日志,用于故障排除。日志解析旨在将日志消息解析为特定的日志模板,通常是实现自动化日志分析的第一步。
人工智能代理能够实现日常参谋任务的自动化,缩短决策时间,并打造更小、更具韧性的指挥所。它们可以精简参谋人员,同时提高其工作效率。
用来保护以色列人民的大数据AI监控系统的设计者,居然用这套系统来网罗性侵儿童,更可怕的是,特朗普把他释放了。
民生银行开展了“大模型安全风险管理及应用评估能力体系建设”项目研究,旨在加强金融行业大模型应用的安全性和合规性保障,提升大模型安全风险应对能力。
本文展示了作为评判器的LLM在面对提示注入攻击时的脆弱性,并提出了JudgeDeceiver,一个基于优化的框架,能够自动生成注入序列,从而操纵作为评判器的LLM的选择。
本文旨在系统梳理欧盟《人工智能法案》的最新实施动态,并介绍关键指南文件的核心内容。通过分析法案的落地进程,我们希望帮助企业更好地把握欧盟人工智能监管方向和实施要...
微信公众号