记者|肖潇

编辑|王俊

12月27日,国家网信办发布《人工智能拟人化互动服务管理暂行办法(征求意见稿)》。新规首次针对“AI情感陪伴”,将其定义为模拟人类特征、思维模式和沟通风格,进行情感互动的产品或者服务。

国内AI情感陪伴市场已经较为成熟,主流模式是由AI扮演虚拟角色,通过聊天推进剧情,用户可以自创AI人设,还可以付费语音通话和解锁专属记忆。AI产品榜11月数据显示,星野(MiniMax)月活已经达到488万人,猫箱(字节跳动)以472万紧随其后,两者断层领先。X EVA(红棉小冰)也有181万月活,筑梦岛(腾讯阅文)则在60万月活左右。

高活跃度背后,是已经基本跑通商业模式的公司。星野的运营公司MiniMax近期向港交所递表,招股书披露,星野和其海外版Talkie在今年前九个月创造了约1.2亿人民币的收入,用户每天在这两款情感陪伴产品上平均花费超过70分钟。

但正因为深度陪伴与高粘性,用户成瘾、情感操纵、未成年人保护一直是AI情感陪伴绕不开的隐患,也是本次《征求意见稿》想要重点回应的现实问题。

在预防成瘾方面,《征求意见稿》要求交互界面显著提示并非真人互动。一旦发现用户连续在线超过2小时,应以弹窗等方式动态提醒暂停使用,同时交互界面需要有清晰的退出选项。

《征求意见稿》还对内容安全提出进一步要求。系统必须能够检测情绪困扰或依赖行为,如果发现用户明确提出自杀、自残等极端情况,需要由人工接管对话,并及时联系监护人和联系人。这也意味着未成年人和老年人用户在账号注册时,就需要提前补充相关信息。

最受行业关注的,是对训练数据的严格限制。《征求意见稿》第十五条明确,除非取得用户“单独同意”,不得将用户交互数据及敏感个人信息用于大模型训练。

同时要注意的是,《征求意见稿》多次强调生命周期责任,AI情感陪伴不仅要在设计阶段考虑安全问题,还要在运行、更新和关闭过程中留意,包括持续的安全监控、持续的风险评估、及时纠正系统偏差以及妥善记录。 可以看出,动态监管的新模式越来越明显,而非把AI视为一成不变的静态问题。

如果《征求意见稿》正式落地,国内现有产品需要补哪些课?

21记者在12月28日梳理了星野、猫箱和筑梦岛三款头部产品,最主要的改动可能会在训练数据授权上。目前,这三款产品均在《隐私政策》中写明,会使用匿名化的对话交互信息用于模型训练和服务优化,采取的是默认同意逻辑,而非单独授权——这也是市面上大多AI产品的做法。

同时,三款头部产品目前也未提供便捷的同意-拒绝授权开关。其都在《隐私政策》中表示,如果用户不希望自己的输入内容用于大模型训练,需要发邮件联系公司撤回。

在AI标识上,三款产品的交互页面都有“由AI生成”标识,但字号、颜色和透明度可能很难称之为“显著”。此前,社会上已发生多起用户误将AI当作真人,甚至线下赴约见面的案例。

(左图:猫箱交互页面的AI标识,为一行白色半透明小字;右图:星野《隐私政策》中对授权数据训练大模型的说明)

相比之下,内容风控是目前完成度最高的环节。我们从业内了解到,国内大模型对自杀等高风险内容,单纯拦截并非主流做法,因为拒答率过高会损伤用户体验,拒答率是公司在实际运营中希望压低的一项指标。

目前的风控流程通常是,大模型识别到用户输入词存在风险,先判断问题类型,再调用另一套敏感问题知识库或安全代答大模型。

“比如有自杀倾向输入,属于需要正面引导的回答,AI会回复引导用户寻求心理医生帮助,或与家人、朋友沟通。”数美公司相关负责人此前告诉21记者。该公司为国内多款产品提供AIGC内容风控。

但预防自杀仍有难点。一位AI合规业内人士曾向21记者指出,社交平台可以结合评论、搜索、浏览内容构建用户画像,从而判断是否存在自杀倾向,但大模型往往只能基于当下输入词做语义判断。更现实的问题是,不少用户已经熟悉如何虚构情节、绕开AI安全审核,这使得AI产品很难做到与社交平台相同深度的自杀干预。

放到全球语境中看,AI情感陪伴引发的安全事件这几年不断累积,已成为少数几个同时引发立法机关、行政部门和司法系统关注的人工智能领域。美国、欧盟及亚洲多国,都在推进针对性的规则建设。

今年6月,国内AI陪伴软件“筑梦岛”因低俗擦边内容,被上海网信办约谈。平台被要求立即整改,健全AI生成合成内容的审核机,尤其是加强涉未成年人不良内容的清理。

在美国,知名产品Character.AI因被指控其互动诱发青少年自杀行为,正面临多起家属起诉。而意大利的数据保护机构还对另一头部产品Replika处以重罚,责令其暂停数据处理并修复年龄验证机制中的缺陷。

目前,美国已在州层面专门针对AI情感陪伴立法,重点指向防沉迷和未成年人保护。纽约州在今年11月要求,所有AI陪伴产品必须明确告知用户“这是人工智能,不是真人”;加州则在10月签署法案,规定企业在明知用户为未成年人时,必须每隔三小时弹窗提醒休息。该法案将于2026年初生效。

声明:本文来自竞争秩序场,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。