【编辑注】2018年4月19日上午,由中国信息通信研究院政策与经济研究所主办的2018大数据产业峰会“数据流通的政策与法律论坛”在北京国家会议中心成功举办。本次论坛邀请到了国家部委领导、科研院所专家学者、产业界代表,与会嘉宾就论坛所聚焦的数据流通领域竞争与规制主题展开了热烈讨论和交流。中国社科院法学研究所研究员支振锋带来主题演讲,围绕《数据权利困局与纾解》,从数据乱象、数据权利化困境、困局纾解三方面进行了详细的分享。

中国社科院法学研究所研究员   支振锋

非常感谢主办方的邀请,让我有机会参加这样一个重要的讨论,今天我汇报的题目也是我自己最近这一两年对数据权利的一些思考。

我们知道在互联网时代数据非常重要,很多关于数据的问题也随之产生,所谓的数据乱象。

针对这个乱象就有不同的思考,有的思考觉得应该数据的权利化是一个解决的方案,但是我可能比较保守一点,我在想能不能用现有的法律规定解决这里边的乱象,所以我从三个方面做一个分享;

首先是数据滥用。今天的确我们会发现在日常生活里边可以看到很多对数据的滥用,或者数据不当甚至非法的使用,刚才时校长讲到“大数据营销里边比如大数据杀熟”实际上我自己亲自做过实验。有一次在上海出差,三个人到B站调研,因为离约定的时间还有一点时间,我们在楼下散步,散步的时候突然说“我们做个实验吧”我们已经住了一家酒店,三个人同时同地,同时打开手机查我们已经住下的那个酒店同样的房型结果三个人价格果然是不一样的,当然我最惨价格最贵,在那一刻大数据杀熟最了解你的人往往最容易伤害你,的确是这样子。这是亲身实验。一方面杀熟不仅仅是在大数据时代存在,传统的也一样,它通过手段和机制把不同支付能力的人区分开来是正当的,熟是正当的,但是如果杀熟这个就要思考,一个可能因为不公平、同样的产品、同样的服务不同的价格这本身意味着一种不公平。还有另外一个考虑,尤其大数据时代可能还有更大的风险,因为不可控和未知。对于传统经营者来讲他杀熟是有限的而且很容易识别,但是对于大数据的经营者来讲我们很难知道自己被杀熟了,很难识别更加不可控,所以才要进行监管。

还有数据的定向营销,最典型的就是炒的沸沸扬扬的facebook,我们以前讲传统的斩首行动,美国人对本拉登看不顺眼就要定点清除,天上有卫星,空中有飞机,地上有导航,才能把本拉登清除掉,到了互联网、社交媒体、大数据的时代,我们看到如果美国对俄罗斯的指责是有道理的话、有一点根据的话,很可能就存在所谓的换首行动,如果不喜欢希拉里就换成特朗普,怎么办呢,利用互联网的手段,通过大数据通过技术和定向营销。这里面就涉及到对大数据它的应用里边哪些方式,首先我们肯定得用,那么哪些方面能用、哪些不能用这得思考。还有刷单、炒信、网络水军。去年暑假去北戴河度假,当时觉得很自我谴责,我也在那个平台上查了北戴河的酒店,一看五星级评价很好,豪华酒店又在海边我就带家人去了,结果去了一看是个农家乐,非常糟糕。我仔细分析下边的评论就发现问题了,很明显是水军在炒信,因为很容易能区分水军和炒信,所以我对我的太太和孩子做了诚挚的检讨,我还做过研究的,结果中招了,这不是研究的不认真吗?

还有数据的非法出售,这里面有很多问题,去年5月份在网安法正式生效之前曾经有一段流行“今天你被抓了吗?”15家数据公司相关人员被带走调查30家数据公司被约谈,有的公司因为这个都退市了,当然另外还有数据大规模的泄露,除了facebook的数据泄露太常见了,前年美国有个中国不太允许存在的网站,一夜情的网站也泄露了客户数据,还有很多数据泄露导致网络诈骗,所以我们去年2月17日有专项个人信息泄露的调查专案。

关于数据也引起了很多的纠纷,比如关于数据的生成、转移、传输、存储存在很多的纠纷,第三方侵入、复制、传播、删除数据引发的纠纷,还有交割不明导致交易纠纷,还有商业利用中产生的法律纠纷。有几典型性的顺风和菜鸟、腾讯和华为、新浪和陌陌,去年年底的时候我跟有关部门组织了几个专家要起草商业大数据的利用,但是后来不是特别顺利。

正是针对这些数据的乱象才有数据权利化的呼吁,也有立法部门曾经试图做一些立法的监管,但是实际上我们想一想,数据里边肯定会涉及到利益,数据相关的肯定也会涉及到一些权利,但是数据本身能被权利化吗?这里边可能要思考,数据当然要涉及到利益,有利益不一定有权利。数据本身也涉及到很多各种各样的权利,但是它本身并不一定能够权利化,或者说权利化是不是最好的解决方案?

我试图看看能不能用传统既有的理论对这个问题做一个可能的解决,我所做的首先我们可能发现在当前不管在实践中还是理论中,实际上可能有一个忽略,就是我们基本上不去区分数据和信息。

如果我们对《网安法》做一个文本解读的话,会发现不光《网络安全法》还有相关的跟网络安全、个人信息保护、司法解释、行政法规、部门规章,实际上里边对于数据和信息有时候经常是不作区分的,作区分的情况极少。

在用的时候我们可以发现,在用数据和信息两个概念的时候,第一对数据和信息两个概念并没有做清晰的界定。第二导致立法里边对于这两个概念应用是混乱的,并不清晰。我试图想,可能我们对于数据和信息本身可以做一个区分,数据它本身呈现的形态或者内在的特质,数据是计算机能够识别的一种形式,或者0或者1,或者实际上以无标识的信息的形式存在,当然不是所有无标签的信息。在座的有很多技术专家对数据可能更了解,我就不做过多的涉及了。

什么是信息?信息不仅仅是比特流不仅仅是没有标识的一些数据,实际上信息里边可能包含更多其他的知识,它是关于人、物、事件、事实、现象和过程与表现形式无关的一些知识,比如说我们可以看到,有些国家设置的信息,有些法律是有界定的。

我想最关键的是信息是包含上下文语境的数据,信息是有标识的数据,没有上下文语境的数据单个的数据没有意义,我们是通过解释上下文创造有用的信息的。这是最根本的数据和信息试着做一下区分。信息是一种特殊类型的数据,如果我们把这个画一个包含图的话,数据的范畴要比信息大,信息是一种特殊类型的数据,数据它是信息一个基本的构成要素。信息它可能是一种知识,它是一种特殊类型的信息。所以在这里边关键就在于这里边有没有上下文的语境,有没有有意义的内容,或者按照《网安法》的界定,能不能和特定的主体联系起来,这个主体如果和个人联系起来就是个人信息,如果和其他的法人主体联系在一起就是机构的信息,公司、法人或者政府信息它是不一样的。

如果说我们有可能对“数据和信息”做这样的区分,我们就发现单纯的数据本身它可能进行数据化、进行权利化是存在困难的,比如这个数据很明显它不具备实质的特定性和独立性,而且数据本身也不一定是人们对于自己的智力创造成果和经营标记、信誉所依法享有的专门的权利,比如知识产权,因为数据的辨识度很低无法垄断和独占。

这里边单纯的数据本身它可能会涉及到很多别的权利,比如整理了一个数据库,这个数据库可能具有单独的知识产权,数据本身不能够被权利化,而且数据是什么东西呢,数据的主体来讲它也是分散和多元的,我们讲传统的权利不管是物权、债权还是知识产权,它的权利主体必须明确,但是数据大多数情况下是以无形的比特流的形式在网络空间流动,所以占有很困难、交互也很困难。也就是说即便能够进行交易也是加工之后的数据。

如果一方面我们暂时搁置数据权利化的方案,并不否认数据可以权利化的可能,我们也不排除有可能权利化是一个更好的方案,但是我在想,如果我们用既有的理论纾解数据权利化困局的话有没有可能的途径?

我们如果已经做了数据和信息的区分首先应该做个人信息的保护,这个要拿出来,在区分个人信息和数据的前提下应该鼓励数据的利用、流动、和交易,但是必须严格保护个人信息。

个人信息应该是严格上保护的,如果利用的话有特定的条件,对于去掉标识数据,不具有个人身份上下文语境的单纯数据是可以利用的,除非特殊情况下可以限制,这就发生了不同的变化。

将来可能会创设个人信息的权利,个人信息有些信息是可以被广泛利用的,比如前段时间在最高院论证过号码标注,电话号码被标为有些骚扰电话,有些营销电话被标注广告电话,这种标注可能有时候涉及到主体的个人信息,不管是个人信息、机构信息,这是可以被利用被标注的。比如学术引证,我特别崇拜时校长的研究,我在我的研究里面引证他们的成果这也是被允许的,他们的姓名、职称、研究成果的标题、发表的载体、时间等等相关的信息也是可以的,当然还包括正向的推广,如一些演艺明星恨不得别人都知道他们的名字,这是可以的,但是一旦涉及到名誉权就要被限制了,有些是可悲限制性的利用,个人征信数据也是可以被利用的,要贷款肯定要用,当然是限制性的利用,不是什么都能用,你的消费数据、位置信息一定程度上也可以被利用,当然要注意隐私保护禁止非法利用。

总之可能包括两种方式:

一种限制利用信息的类型,有些信息原则上是不能被利用的,要限制、要分类,比如你的收入情况、你的金融帐号密码,社保帐号的密码,这原则上除非特定主体是原则上禁止利用的。

另外一个限制利用信息的方式,比如某些信息不能在某些领域或者不能以某些用途去利用,要做限制,像我们说的,可以收集我们的个人信息做大数据的利用分析,也可以把不同具有支付能力的客户给识别出来,但是不能进行不公平的服务,也不能做更进一步的滥用。

对于数据来讲,如果一旦把信息和数据剥离的话,那么数据原则上是可以利用的,当然在利用的过程里边要进行相关的权益保护,一个是互联网企业内部的数据利用,它里边有《公司法》的信息披露义务或者强化企业内部的数据治理。当然我们对大数据利用还有很多别的约定条件,这个大家了解的比较多。

那么在不同权利化的情况之下如果我们要用怎么办、怎么进行交易?权属可能不一定完全界定,或者没有完全权利化,实际上《合同法》并不是不能解决,《合同法》虽然规定了15类合同,但是还可以用无名合同的方式去解决,这里面可能有一套解决的机制。如果你的数据库去了标签化、加工成了数据库,那里面可能有知识产权或者别的权利,当然里边可能涉及到不正当竞争、垄断等等。

最后我想分享几点思考:

1、我们每个人都很在乎个人的隐私,都很在乎个人得数据,我们并不像某些互联网巨头所说的“中国的老百姓不注重个人得隐私、不注重个人的数据”我们很在乎我们很重视,但是并不表明它不可以被利用,因为如果每个人都不让度任何数据那么可能就没有互联网上了,我们也享受不到相应的便利了。所以每个人我们生活在这个时代,这也是我们生存的一个前置条件,我们必须让度某些信息,有些时候甚至是免费的,所谓授人玫瑰手有余香,这是互利的。

2、另一方面如果里面有问题的话,我们尽可能不要把问题复杂化,如果能在既有的传统的法律框架内能够把它覆盖、能够把它解决的话,我们也没有必要做那么多创新,有的时候对于制度来讲、对于理论来讲成本最小的才是最好的,最简单的才是最好的,它跟技术可能不太一样,理论和制度的创新应该遵守简约的原则。

3、网络的价值在于互通,信息的价值在于交流;我们很在乎个人的隐私,很在乎个人的数据,但是我们还是要把它拿出来在法律规定的范围内,在保护权利的前提下去使用它,因为这是互联网大数据,不管将来人工智能,我们知道人工智能现在不是我们想的那么能,还是暴力计算、算法和大数据支撑的一个产物,如果我们不用这些数据、不让度这些数据的话一切都是零,我们今天就没有必要在这里讨论了。

我就跟大家分享一些不成熟的看法,请大家批评指正。

声明:本文来自CAICT互联网法律研究中心,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。