本文的研究为理解和防御 LLM 越狱提供了新的视角,也提醒业界亟需更加透明且强健的防御机制,以提升 AI 安全与伦理的底线保障。
DeepSeek的AI应用也被欺骗到了。
现有的方法对大语言模型(LLM)「越狱」攻击评估存在误判和不一致问题。港科大团队提出了GuidedBench评估框架,通过为每个有害问题制定详细评分指南,显著降低了误判率,揭...
消息公布后CyberArk股价大涨13%,市值达218亿美元。
美国地方医疗机构BJC医疗保健中心已同意支付最多6635万元达成和解,此前该机构的网站使用追踪工具收集用户个人敏感数据并传送至脸书、谷歌等公司,但未获用户的知情同意。
政策驱动与AI赋能共振。
在俄罗斯全面入侵乌克兰的第四年,一个愈发明显的事实浮出水面:最具决定性的战斗已不再局限于空中或地面。
确定一个自治系统背后的运营组织是互联网分析测绘的基础数据,这远比想象中的要困难。
检察机关依法惩治电商黑灰产犯罪,持续优化网络营商环境。
需要警惕的是,一些别有用心的设计或恶意植入的技术后门,可能成为失泄密的导火索。
在生成式人工智能时代,我们如何保护数据?
可能引发缓存投毒与拒绝服务攻击,危及 DNS 基础设施安全。
此次事件标志着网络战正从传统的分布式拒绝服务攻击(DDoS)和网站篡改,转向更具破坏性的、针对关键工业基础设施的“歼灭战”。
系统性梳理低空数字底座行业定位、功能特点、应用成效、技术架构等内容。
选取2起典型事件予以公布,为重要行业领域提供安全预警。
系统解析人工智能对网络攻防的多维影响。
本文件规定了政务大模型应用的安全要求,包括模型选用、模型部署、模型运行等。
萌新必看!职场“打怪”修炼手册。
护网-2025 | 违法信息未阻截?公安机关依法处罚!
“GPUHammer”攻击可通过诱发GPU显存中的比特翻转(bit flip)现象,实现对AI模型等关键数据的破坏性篡改。
微信公众号