2025.02.11 沈程
2024年12月25日,全国人民代表大会常务委员会发布了《中华人民共和国反不正当竞争法(修订草案)》(“《反法修订草案》”),其中第十三条对“互联网专条”进行了修订,增加了对“以欺诈、胁迫、电子侵入等不正当方式,获取并使用其他经营者合法持有的数据”等行为的具体规定。近日,某国产人工智能(AI)大模型在各项测试中表现出其卓越能力,引发了国内外AI行业和资本市场的热议。伴随着热议的也有争议,其中有人质疑认为该模型在训练过程中可能未获授权使用了另一知名模型的输出数据作为训练材料,利用蒸馏技术获取另一模型的知识来进行模型开发,从而可能违反了相关服务条款,但也有人指出这一指控并不属实且无法律依据。
本文无意对上述争议进行具体评判,但该争议引发了笔者关于“互联网专条”修改内容的思考。本次“互联网专条”的修订体现了对围绕数据所产生的竞争性权益的保护倾向,是对此前诸多司法案例的有益总结。尽管如此,在AI大模型及其应用开发的竞争正日趋激烈的当下,如何既确保对“数据权益”的合法保护,又不至于“过度威慑”科技创新,是始终值得法律行业探讨的话题。
一、《反法修订草案》第十三条增加数据权益保护条款回应了现实需求
1、AI三要素包括了数据、算法和算力,数据是AI的根基。如果将构成AI的计算机神经网络比喻成树木和其茂密的枝丫,那么数据就是这些树木所根植的土壤和其中的水分,在自然规律(算法)的指挥和阳光(算力)的助力下,最终将成长为充满生机的森林。
2、数据在当今以人工智能为代表的各行各业中扮演着极为重要的角色,对于数据的高效开发和使用助力了许多行业和公司的快速发展。我们理解,对于数据权益的保护不仅是出于个人信息或商业秘密的考虑,也是维护企业正当发展权益的核心所在。
3、近年来,司法实践中涌现出不少涉及数据权益的案件,常见的不正当获取数据的行为包括了“破解加密”、“网络爬虫”、“撞库”等,而不正当使用数据的行为则有“抓取数据后提供替代性服务”、“抓取数据后提供分析建议”、“提供大规模抓取数据或制造虚假数据的工具”等。从保护数据权益的路径而言,较多案件以《中华人民共和国反不正当竞争法》(“《反不正当竞争法》”)为裁判依据,尤其是互联网专条的兜底条款(即第十二条第二款第四项)[1]。例如,杭州互联网法院公布的数据和算法十大典型案例之五的(2021)浙8601民初309号判决便依据该条款对某公司利用爬虫工具抓取微信社交数据的行为作为了负面评价。总体而言,在此类案件中裁判者认可持有、控制数据的主体在满足一定条件的情形下对于相关数据享有竞争性权益,可以依据《反不正当竞争法》受到保护并行使维权权利。
4、有鉴于上述情形,《反法修订草案》第十三条增加专门的数据权益保护条款回应了现实需求,如果得到采纳,此后在类似案件中可能不必再援引现行《反不正当竞争法》互联网专条的兜底条款,而有更加具体明确的法条依据,有利于统一裁判尺度和维护法律的可预测性。我们也认为《反法修订草案》有关保护数据权益的修改是积极有益的尝试,但需要考虑的是数据权益的保护范围和保护方式,以平衡维护合法权益和鼓励社会创新两方面的诉求。
二、从有关“蒸馏”技术的争议看《反法修订草案》第十三条的修改内容
1、基于初步学习和了解,我们理解“蒸馏”技术常用于AI模型和应用的开发,可以被用于自然语言处理、计算机视觉和语言识别等领域。简单地理解,“蒸馏”技术就是将大模型(教师模型)的知识传递给小模型(学生模型),在使用“蒸馏”技术进行开发的过程中,可能会需要调用教师模型的输出层数据(例如,软标签等)、中间层数据(例如,特征图等)以及模型参数数据(例如,注意力权重等)。也就是说,在学生模型的开发过程中,会必不可少地使用教师模型的一些数据,这些数据既可能涉及基础数据,也可能涉及教师模型的一些算法、架构、参数设计和输出内容。学生模型不仅会学习结果,还会学习为什么会得出了这样的结果,即“知其然,更知其所以然”。由此可见,在AI模型和应用的开发过程中必然涉及数据的流动,因此有可能在数据权益保护方面产生纠纷。
2、针对数据权益的保护,除了从不正当竞争的角度出发,也可能涉及知识产权、商业秘密、合同约定等,由于知识产权、商业秘密有其特定的法律保护范式,而合同约定则主要基于意思自治(包括开源或闭源的条款等),在此不展开论述。根据近年来我们参与不正当竞争案件的经验,在部分案件中,裁判者似乎存在将竞争权益当作绝对权进行过度保护的倾向,一方面认可现有的业务模式或技术模式的经营者建立了竞争性壁垒,另一方面对新进入者的经营模式和运营方式提出很高的道德和法律要求。在我们看来,竞争性权益不同于著作权、专利权等绝对权,竞争性权益的保护门槛更高,因为竞争性权益解决的是绝对权所不能触及的领域,其所涉及的范围更广,适用时更应当注意谦益性。在高度竞争的市场中,竞争常常带来此消彼长,因此不能将造成损害作为保护竞争权益的唯一或核心依据,主张竞争性权益的经营者必须先对其应当受到保护进行论述和证明。此外,关于竞争性权益的保护,也应当注意其保护范围,对于不正当竞争行为进行规制的同时,不能任意地将所谓经营或技术模式设定为应当受到绝对保护的客体。
3、本次《反法修订草案》第十三条第二款第四项的全文是:“经营者不得利用数据和算法、技术、平台规则等,通过影响用户选择或者其他方式,实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为:(四)以欺诈、胁迫、电子侵入等不正当方式,获取并使用其他经营者合法持有的数据”。根据该条款的内容来理解,其主要规制经营者以不正当的方式获取和使用其他经营者合法持有的数据从而妨碍、破坏其他经营者合法提供的网络产品或服务正常运行的行为。正如上文所述,我们认为创新行为既可能是温和的小创新,也可能是破坏性创新,不能将是否造成另一经营者的损害作为判断是否构成不正当竞争行为的唯一或核心依据;相反,在评估和分析是否构成不正当竞争行为时,需要结合是否存在应当被保护的竞争权益、经营者的主观状态、客观行为以及对市场竞争、消费者的影响等进行综合判断。
4、基于以上立场,针对《反法修订草案》第十三条第二款第四项的拟修改内容,我们有如下个人观点,仅供讨论:
(1)首先,对“合法持有的数据”进行竞争利益的保护,其法律门槛似乎偏低。既有的许多司法案例中,裁判者在对数据权益进行保护前,都要从经营者对相关数据的资本投入和劳动付出、技术开发和资源整合等角度来论述经营者对于形成受法律保护的数据权益所作出的贡献,从而进一步论述其数据权益应当受到《反不正当竞争法》保护的必要性和合法性。我们注意到,国家市场监督管理总局(“市监总局”)曾在2022年11月22日发布过《中华人民共和国反不正当竞争法(修订草案征求意见稿)》(“《征求意见稿》”),其中第十八条2对受保护的“商业数据”进行了定义,即“本法所称商业数据,是指经营者依法收集、具有商业价值并采取相应技术管理措施的数据”。该征求意见稿的条文明确了如果数据权益要受到《反不正当竞争法》的保护,需要达到一定的门槛,包括商业价值和权利人的技术管理等。我们认为,前述市监总局的立法思路有一定可取之处。如果对“合法持有的数据”进行广泛的竞争利益保护,似乎有扩大保护范围的嫌疑,较容易成为大型企业、平台企业、传统企业对小型企业、创业企业、新兴企业进行“打击”的工具,并可能在某种程度上抑制了对各类创新的尝试。另外,如果经营者对其他经营者“合法持有的数据”存在其他侵权或违法行为的,完全可以依据《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规进行维权和打击。
(2)其次,未规定“妨碍、破坏网络产品或者服务正常运行”的程度,可能导致该条被过度泛化使用。市场竞争带来的此消彼长甚至损害都是常见的,参与市场竞争的主体对于其他主体的竞争行为有一定的容忍义务[3]。只有不正当竞争行为产生具体后果且达到较为严重程度时,才应当由《反不正当竞争法》介入进行规制。《征求意见稿》中曾提出以“不合理地增加运营成本”、以及“实质性替代产品或服务”作为判断构成不同类型的数据不正当竞争行为的标准。我们认为,在快速发展的互联网和人工智能行业,不能排除新的业务或技术模式对原有模式产生一定程度的“妨碍”或“破坏”,但该等“妨碍”或“破坏”是创新的伴生产物。以网约车平台业务为例,如今评价网约车平台是移动互联网发展到一定阶段的创新产品,相信反对者会很少,但在该业务模式刚刚出现时,不仅出租车行业的从业者有较大的反对声浪,对于不熟悉移动互联网的消费者群体(例如部分老年消费者)也产生了打车不方便等负面影响。即便时至今日,也不能说网约车平台业务已经完全成熟到没有任何可改进余地的地步,但科技进步的潮流决定该业务模式的持续存在将是不可逆转的事实,直至其被新的业务模式所取代。因此,我们认为在立法中提高“妨碍、破坏”的判定标准并将此作为维护数据权益的前提,可能更有利于引导而非“过度威慑”创新。
(3)再次,可以考虑针对该条款设置“除外情形”,以平衡保护和创新两方面的利益。以AI模型的开发为例,在全世界范围内,利用“蒸馏”技术进行开发的案例并不鲜见,模型的不停迭代和发展并不完全是凭空创造的,常常是站在巨人肩膀上的成果。我们建议,立法者可以考虑如果经营者能够证明其行为符合以下一种或多种情形的,可以不认定其行为构成了对于数据权益的不正当竞争或可以豁免不正当竞争的法律责任:第一、相关数据可以从公共渠道获得和使用,对维权主体不产生损害或损害非常有限,不构成实质性损害;第二、其商品或服务创新产生了独立价值,整体上有益于促进市场竞争,使得消费者群体获益;第三、其行为符合相关行业或区域的常见实践,且被从业者普遍接受和认可等。
随着地缘竞争的加剧,没有一个时期像现在一样,让我们更加期盼中国创新能够在全世界发出响亮的声音。就立法层面而言,对于非绝对权的数据竞争权益的保护,在回应现实需要从而作出具体规定的同时,也应当给创新和发展留下足够的余地和容错空间。
1. 《中华人民共和国反不正当竞争法》(2019年修正)第十二条第二款第四项:经营者不得利用技术手段,通过影响用户选择或者其他方式,实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为:(四)其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为。
2. 中华人民共和国反不正当竞争法(修订草案征求意见稿)第十八条:第十八条 经营者不得实施下列行为,不正当获取或者使用其他经营者的商业数据,损害其他经营者和消费者的合法权益,扰乱市场公平竞争秩序:
(一)以盗窃、胁迫、欺诈、电子侵入等方式,破坏技术管理措施,不正当获取其他经营者的商业数据,不合理地增加其他经营者的运营成本、影响其他经营者的正常经营;
(二)违反约定或者合理、正当的数据抓取协议,获取和使用他人商业数据,并足以实质性替代其他经营者提供的相关产品或者服务;
(三)披露、转让或者使用以不正当手段获取的其他经营者的商业数据,并足以实质性替代其他经营者提供的相关产品或者服务;
(四)以违反诚实信用和商业道德的其他方式不正当获取和使用他人商业数据,严重损害其他经营者和消费者的合法权益,扰乱市场公平竞争秩序。
本法所称商业数据,是指经营者依法收集、具有商业价值并采取相应技术管理措施的数据。
获取、使用或者披露与公众可以无偿利用的信息相同的数据,不属于本条第一款所称不正当获取或者使用其他经营者商业数据。
3. 该等观点可以参考浙江省高级人民法院审理的(2020)浙民终479号民事判决。