2025年9月17日上午,在昆明召开的国家网络安全宣传周人工智能安全治理分论坛上,生成式人工智能安全测评基准数据集1.0正式发布,并在中国网络空间安全协会(https://www.cybersac.cn/newhome)“中文互联网语料资源平台”上线。

随着技术的快速深入和应用的广泛落地,生成式人工智能应用新型风险不断涌现,传统的测试集暴露出覆盖场景单一、有效知识点不足、测试方式多样性欠缺等短板,难以有效适应模型应用形式变化、全面客观评估安全风险。面向生成式人工智能应用场景多元化、风险演变复杂化等发展态势,国家互联网应急中心依据《生成式人工智能服务管理暂行办法》、《生成式人工智能服务安全基本要求》等,构建了安全测评基准数据集1.0。共包含3000个测试题,具有风险知识精细化、应用场景多元化、测试方法丰富三方面特点。

● 测评内容方面,覆盖《生成式人工智能服务安全基本要求》中的5大类31小类风险,并结合工作实践细化成三级200余个子类,保障安全测评有效覆盖主要风险点;

● 测试场景方面,覆盖聊天问答、写作创作、总结摘要、校对改写、智能回复等10个主流云端和移动端应用场景,多方位评估安全风险;

● 测试方法方面,模拟10种潜在的恶用滥用方式,多手段挖掘隐蔽安全风险。

国家互联网应急中心按照科学、规范、可信的原则,持续构建生成式人工智能安全测评技术手段,建设智能对智能的安全测评平台,客观、全面、有效的排查安全风险,促进行业健康有序发展。本数据集的发布有助于为生成式人工智能安全测评提供基准和指引,促进多领域可信应用。

声明:本文来自国家互联网应急中心CNCERT,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。