生成式人工智能安全测评基准数据集1.0发布

2025年9月17日上午，在昆明召开的国家网络安全宣传周人工智能安全治理分论坛上，生成式人工智能安全测评基准数据集1.0正式发布，并在中国网络空间安全协会（https://www.cybersac.cn/newhome）“中文互联网语料资源平台”上线。

随着技术的快速深入和应用的广泛落地，生成式人工智能应用新型风险不断涌现，传统的测试集暴露出覆盖场景单一、有效知识点不足、测试方式多样性欠缺等短板，难以有效适应模型应用形式变化、全面客观评估安全风险。面向生成式人工智能应用场景多元化、风险演变复杂化等发展态势，国家互联网应急中心依据《生成式人工智能服务管理暂行办法》、《生成式人工智能服务安全基本要求》等，构建了安全测评基准数据集1.0。共包含3000个测试题，具有风险知识精细化、应用场景多元化、测试方法丰富三方面特点。

● 测评内容方面，覆盖《生成式人工智能服务安全基本要求》中的5大类31小类风险，并结合工作实践细化成三级200余个子类，保障安全测评有效覆盖主要风险点；

● 测试场景方面，覆盖聊天问答、写作创作、总结摘要、校对改写、智能回复等10个主流云端和移动端应用场景，多方位评估安全风险；

● 测试方法方面，模拟10种潜在的恶用滥用方式，多手段挖掘隐蔽安全风险。

国家互联网应急中心按照科学、规范、可信的原则，持续构建生成式人工智能安全测评技术手段，建设智能对智能的安全测评平台，客观、全面、有效的排查安全风险，促进行业健康有序发展。本数据集的发布有助于为生成式人工智能安全测评提供基准和指引，促进多领域可信应用。

声明：本文来自国家互联网应急中心CNCERT，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

生成式人工智能安全测评基准数据集1.0发布

面向数据要素流通的商用密码安全保障体系研究

国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》

开源情报中数据过载问题的破解之道