编辑提示
《中共中央关于进一步全面深化改革 推进中国式现代化的决定》提出,要健全因地制宜发展新质生产力体制机制,健全相关规则和政策,加快形成同新质生产力更相适应的生产关系。生成式人工智能是新质生产力的代表性成果,2025年《政府工作报告》提出,要激发数字经济创新活力。持续推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用。在此方面,我国近期取得了突出成果,发布了自主研发的高性能生成式人工智能大模型DeepSeek,其不仅既做到了低成本、高性能的技术突破,而且采取了免费开放模型权限的开源发展模式,在社会各界引发了“DeepSeek+”的应用热潮。为服务保障DeepSeek等生成式人工智能大模型的应用实践,《法律适用》“实践法学笔谈”栏目组织专栏讨论,分别邀请法官和专家,通过“短小精悍、务实管用”的系列文章,对生成式人工智能大模型应用的法治保障作出初步探讨。具言之,本组稿件重点关注三方面内容。一是人工智能开源模式的法治保障,重点关注DeepSeek应用过程中新出现的知识蒸馏和开源许可证制度,讨论人工智能产业发展中开创性的商事决策的合法性及潜在法律风险点。二是DeepSeek生成内容应用中的版权保护和侵权规制。一方面,目前在媒体平台可见大量以DeepSeek问答为内容的热搜事件和爆款文章,这些人工智能生成物的版权侵权规制已经彻底走进现实,传统版权法的合理使用、避风港规则和复制行为认定等理论均须作出因时调整;另一方面,人工智能本身也可能造成侵权,侵权法上应将之界定为产品还是服务,如何认定DeepSeek服务提供者对侵权应用的过错,均需要进一步的澄清。三是人工智能对法律职业的影响。DeepSeek极大地提升了知识生产的效率,深刻地影响着法律职业的发展前景。不过,人工智能虽性能强大,但也做不到彻底替代法律人士。DeepSeek等可高效地完成“辅助梳理案卷材料”“辅助检索法律依据”等工作,但是对于案件的事实认定和法律适用,还是需要由法律人进行妥当、精准的判断把握。本组稿件凝聚了理论与实务界的专家共识,选题与论点均具有前瞻性和可行性,期待为社会科技发展影响作出智识贡献。
姚志伟
广东财经大学法学院教授,人工智能法研究中心主任
本文系最高人民法院2024年度司法研究重大课题"涉数字经济司法问题研究"(课题编号:GFZDKT2024B12-2)的阶段性成果
在3月4日召开的全国两会新闻发布会上,大会发言人娄勤俭表示,DeepSeek公司取得的重大进展,代表着一批中国公司在人工智能领域的崛起。DeepSeek公司坚持开放开源的技术路线,开源共享推动了人工智能技术在全球的普遍应用,为世界贡献了“中国智慧”。通过DeepSeek这类公司的兴起,我们可以看到中国在科技发展上的创新性和包容性。[1]在这个背景下,DeepSeeK的火热,也引发了一些相关法律问题的讨论,其中尤为重要的是AI大模型研发中知识蒸馏行为的合法性。
一、问题的提出
DeepSeek模型的训练成本不到美国OpenAI公司的Gpt-4o人工智能模型的1/10,但性能却可与之媲美。[2]DeepSeek模型开发中使用的重要技术是知识蒸馏(Distillation)技术(以下简称“蒸馏技术”)。[3]所谓“蒸馏技术”,其本质是对复杂模型(教师模型)知识的提炼和压缩,并将知识转移到一个学生模型。学生模型通常更小、更高效,但可以实现与教师模型相似的性能。[4]需要指出的是,在蒸馏过程中,学习的内容通常是知识而非模型参数。学生模型在知识方面和教师模型近似,但二者的模型参数往往并不相同。需要说明的是,本文仅讨论典型知识蒸馏行为(即使用教师模型的生成物训练学生模型)的合法性,没有讨论非法获取他人模型参数作为自身模型主要参数的问题。[5]
蒸馏技术对于人工智能行业后发者追赶行业先行者,特别是领先的巨型企业具有十分重要的意义,也可以避免行业“重复造轮子”。DeepSeek在受到广泛关注的同时,也遭受了一系列的法律挑战,其中一个重要的方面是蒸馏行为的合法性问题。[6]本文对此进行初步考察,并提出从利益平衡、促进产业发展的角度应肯定蒸馏行为的合法性。
二、蒸馏行为的合法性风险
虽然蒸馏技术具有较为重要的意义,但从DeepSeek所遭遇的法律挑战中,也能观察到蒸馏行为在现行法下的合法性可能会受到多方面的质疑。
(一)合同违约的风险
人工智能模型的用户协议(开源模型则往往采用许可证的方式)普遍会约定禁止蒸馏行为。例如,OpenAI在其用户协议中明确约定“禁止利用人工智能的输出内容开发与OpenAI存在竞争关系的模型”。[7]
在这样的情况下,学生模型研发者违反该约定进行蒸馏,就会被认为违约,存在承担违约责任的风险。据《金融时报》和彭博社报道,美国OpenAI公司的用户协议要求用户不得使用其产品输出内容开发与其竞争的模型。为此,OpenAI及其主要投资方微软公司正在全面调查DeepSeek的开发公司杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索公司”)的违约行为。[8]随后,OpenAI又发表声明,表示不会起诉深度求索公司。[9]但是,OpenAI这次不起诉的声明,并不代表其后续不会针对其他蒸馏行为起诉,也不意味着其他公司不会起诉。只要蒸馏行为违反用户协议,违约风险就仍然存在。
(二)构成不正当竞争的风险
蒸馏行为存在被认定为构成不正当竞争的风险。虽然反不正当竞争法对蒸馏行为没有专门进行规制,但是教师模型的研发方仍然可以援引《反不正当竞争法》第2条(即一般条款),指控从事蒸馏行为的学生模型研发方,扰乱市场竞争秩序,损害其他经营者或者消费者的合法权益,从而构成不正当竞争。其理由包括:一是学生模型研发方违反用户协议或许可证;二是蒸馏行为利用教师模型的生成物进行训练,降低自身训练成本,是一种典型的“搭便车”行为;三是蒸馏产生的学生模型和教师模型往往还存在直接的竞争关系;四是蒸馏行为导致教师模型研发者花费巨资进行训练所产生的竞争优势大打折扣。
(三)侵害商业秘密的风险
蒸馏行为可能还存在侵犯商业秘密的风险,有观点认为相比著作权侵权,侵害商业秘密才是蒸馏行为的真正风险。[10]但DeepSeek被OpenAI所指控蒸馏的知识,难以符合“不为公众知悉”“采取了合理的保密措施”要件,从而构成商业秘密。此外,在侵犯商业秘密问题上,一个十分重要的问题在于,蒸馏行为可能被视为“反向工程”,从而不构成侵犯商业秘密,对这个问题的讨论还刚开始,需要进一步研究。[11]
(四)著作权侵权的风险
蒸馏行为是利用教师模型的生成物进行训练,如果生成物构成作品,受到著作权法的保护,则蒸馏行为存在侵犯著作权的风险。生成物是否构成作品,是一个极富争议的问题。我国现行法对于这一点并无明确规定,但司法上,北京互联网法院、常熟市人民法院和武汉东湖新技术开发区人民法院的判决都支持了生成物构成作品。但从国外立法来看,美国版权局持较为保守的立场,明确完全由人工智能生成的内容无法获得版权保护。当然,除了生成物的可版权性外,蒸馏行为是否构成著作权侵权还需要考虑其他因素,包括生成物的著作权是否归属于用户,以及蒸馏行为是否构成合理使用等。
三、蒸馏行为合法性的实质考量
上文从现行法的角度分析了蒸馏行为的合法性风险,但是蒸馏行为是随着人工智能产生的新型行为,现行法并未对其进行专门规制。对这种新型行为合法性,应从利益平衡、促进产业发展等角度作实质分析,肯定蒸馏行为的合法性。
(一)利益平衡的必然要求
从利益平衡的角度而言,大型人工智能研发企业不能一方面要求无须获取许可且无偿使用他人作品进行训练;另一方面又禁止他人使用其模型生成物训练模型。人工智能研发企业普遍主张在训练中使用他人作品构成合理使用,即可以不经许可且无偿地使用他人作品进行训练。其核心理由是如果不构成合理使用,则必然极大增加人工智能模型研发的成本,不利于人工智能产业的发展。一些国家(例如日本)在立法上开始探索在训练中使用作品构成合理使用,我国杭州互联网法院也作出了使用他人作品训练人工智能构成合理使用的判决。合理使用对于减轻人工智能研发企业的负担,促进产业发展有着极为重要的意义。同样,蒸馏行为也可以极大地减轻人工智能研发企业,特别是中小型人工智能研发企业的负担,避免“重复造轮子”,促进人工智能产业的发展。
有学者指出:“在法庭上,许多模型创建者辩称,根据合理使用抗辩,这些从数十亿个网站页面上搜刮来的数据可以用于训练。然而,对于那些试图从他们的模型中学习以开发自己的模型的竞争者也试图以类似的合理使用抗辩来应对他们。”[12]可以这样认为,反对蒸馏的人工智能研发企业陷入了一种自我矛盾之中,如果他们主张蒸馏行为不构成合理使用,则可能使得使用作品训练人工智能的合理使用抗辩也不能成立。[13]如果使用作品训练的合理使用不被支持,人工智能研发企业的利益损失可能更大。因此,从利益平衡的角度而言,既然允许人工智能研发企业可以不经许可且无偿使用他人作品进行训练,也就应该允许以蒸馏技术使用模型生成物进行训练。
(二)促进人工智能行业健康发展的需要
人工智能模型的研发对算力和数据的要求越来越高,导致以传统方法研发模型的成本越来越高。据相关报道,GPT4的训练成本达到了6300万美元,[14]这使得模型研发成为巨型企业的游戏。鉴于人工智能模型,特别是基础模型的极端重要性,掌握模型的少数巨头企业会掌握极大的权力。正如学者所指出的:“允许权力集中于少数人工智能公司是不可取的,甚至可能是危险的。”[15]人工智能模型的研发不仅应有OpenAI这样的巨型企业,也应该有DeepSeek这样的中小型企业的广泛参与。蒸馏技术能够使得中小企业站在巨人的肩膀上,极大地降低了人工智能模型的研发成本,使得整个行业的竞争更为健康。从人工智能行业国际发展的角度而言,美国是人工智能模型的先发国家,主要的人工智能巨型企业集聚于美国,在研发成本高昂的情况下,其他后发国家难以追赶。通过蒸馏等技术可以低成本进行研发,为后发国家提供了新的机会。因此,从促进人工智能行业健康发展的角度出发,也有必要肯定蒸馏行为的合法性。
四、结语
本文从DeepSeek事件出发,讨论了知识蒸馏行为在现行法下的合法性风险,以及从利益平衡、促进产业发展的角度初步论证了应肯定其合法性。2025年《政府工作报告》提出,要持续推进“人工智能+”行动,支持大模型广泛应用。肯定知识蒸馏行为的合法性,能够有效促进大模型产业的健康发展,为“人工智能+”行动提供有效支持,也可以体现我国对人工智能创新发展的包容性。最后需要说明的是,由于篇幅所限,本文对给予知识蒸馏行为合法性的制度路径未予展开论述,留待日后探讨。
注释
[1] 新华社:《再成热点!这场重要发布会上,谈到了DeepSeek》,载微信公众号“新华社”2025年3月4日。
[2] 参见刘扬、任重:《突然火爆全网!中国“神秘力量”震动美国科技圈》,载微信公众号“环球网”2025年1月27日。
[3]See Daya Guo, et al., DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, arXiv preprint arXiv:2501.12948 (2025).
[4]相关技术论文可见 Geoffrey Hinton, Oriol Vinyals & Jeff Dean, Distilling the Knowledge in a Neural Network, arXiv preprint arXiv:1503.02531 (2015).
[5]笔者倾向于后者行为构成不正当竞争。
[6]本文并没有主张或者暗示DeepSeek的开发者深度求索公司蒸馏OpenAI的模型,以及这种蒸馏对于DeepSeek的卓越性能起着决定性作用。
[7]See OpenAI, Terms of Use, (December 11, 2024), https://openai.com/policies/terms-of-use/.
[8]See Cristina Criddle & Eleanor Olcott, OpenAI says it has evidence China’s DeepSeek used its model to train competitor (January 29, 2025), https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6.
[9]参见粘轶锋、田宝剑:《涉及DeepSeek,OpenAI发声》,载微信公众号“参考消息”2025年2月4日。
[10]参见李汶龙:《模型蒸馏说到底是个商业秘密问题》,载微信公众号“科技利维坦”2025年2月19日。
[11]See Camilla Alexandra Hrdy, Trade Secrecy Meets Generative AI, available at SSRN (February 6, 2025).
[12]See Henderson, Peter, & Mark A. Lemley, The Mirage of Artificial Intelligence Terms of Use Restrictions, arXiv preprint arXiv:2412.07066 (2024).
[13]同上注。
[14]See Dylan Patel & Gerald Wong, GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE, semianalysis (July 10, 2023), https://semianalysis.com/2023/07/10/gpt-4-architecture-infrastructure/.
[15]同前注[12]。
文字编辑:王常阳
排版:严嘉欢
策划:姜 丹
执行编辑:刘凌梅
*本文为作者个人观点,仅供理论研究和实践探索参考。
声明:本文来自法律适用,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。