AI制药中的IP：如何增加价值和规避风险

2022.10.27 朱坚吴瑜毛健 Joanna Wang 李惠原

人工智能（AI）在新药研发领域的应用日益广泛。AI制药公司通过AI和大数据的结合，帮助加速新药研发，包括筛选老药新用策略、挑战难以成药的靶点、生成全新结构的化合物、设计化学合成路线、辅助临床实验设计等等1。

AI制药公司的一种商业模式是与新药研发企业（药企）合作，助力药企研发新药。例如，AI制药公司提供AI技术，药企提供输入数据，双方合作通过AI技术从大量的输入数据中识别或转化出有应用价值的输出结果。这种商业模式在本质上涉及AI制药公司为药企提供技术服务，产生知识产权（IP）。

与传统新药研发的合作项目相比，AI新药研发所涉及的技术和IP都有所不同。本文旨在从价值和风险两个角度，探讨在AI新药研发中合作双方各自拥有和产出哪些IP，以及应注意哪些潜在的IP风险。

1、价值和IP在哪里

（一）背景IP

i. AI制药公司可能拥有的

从技术角度，AI制药公司通常拥有自研的AI算法和AI软件，以及某些情况下，经过独特分析处理的训练数据库和模型。这些都可能构成AI制药公司的背景IP，可以通过专利、技术秘密、著作权等不同的知识产权形式进行保护。对于不同的技术内容，采取何种形式的IP进行保护，需要AI制药公司认真考虑和布局。对于可以用专利保护的背景IP，AI制药公司可以考虑尽早申请专利。

ii. 药企可能拥有的

药企的背景IP通常涉及其提供的输入数据，以及在合作领域已经申请的专利和积累的经验等。举例来说，药企可以为AI制药公司选定靶点、提供小分子化合物库、基因组学信息、化学、临床数据等信息作为输入数据或训练数据；另一方面，药企在合作领域已有丰富的知识和经验，这些可以用于对AI输出结果提供反馈，进而帮助优化AI算法或模型，提高数据分析和输出数据的质量。

（二）前景IP

AI新药研发项目的主要成果包括，通过AI技术运算得到的与新药研发相关的输出结果，例如：化合物的筛选结果、从头生成的全新化合物分子、新的药物靶点、或者已有药物的新用途等2。除此之外，项目中还可能会形成与AI算法相关的衍生信息，例如经过分析处理的输入数据、迭代的AI模型、最终的AI模型、以及AI模型直接输出的数据等。

i. 新药相关的成果

新药相关的成果是药企寻求合作的最终目的，因此药企通常希望拥有相关的知识产权。在不同的项目中，药企和AI制药公司可能不同程度地对新药相关成果有一定的贡献，但相关成果的IP通过何种方式保护、如何归属、使用权如何许可等，则可以由双方具体约定。

ii. AI技术相关的成果 - 数据和模型

AI新药研发项目另一方面的产出成果涉及数据，例如，对原始输入数据进行分析处理（例如特征提取）得到的预处理数据，以及通过AI模型直接得到的输出数据。

对于从药企原始数据衍生得到的预处理数据或输出数据，药企有权主张一定的权利。同时，如果数据衍生过程也结合了AI制药公司的专有技术， AI制药公司也将有权主张一部分权利。

此外，在AI新药研发项目中，原始的AI模型会发生优化和迭代，得到一系列迭代模型（包括最终模型）。这些模型可能既包含了AI制药公司在模型设计与训练方面的贡献，也基于药企提供的数据和专有技术和知识得以进一步训练和优化。

由于整合了双方的贡献，因此有可能双方均有权主张对迭代模型的至少部分权益。合作双方对迭代模型的贡献大小可以体现在迭代前后模型本身的改进程度，以及药企提供的数据对于模型迭代的重要程度。实践中，AI制药公司通常希望拥有对迭代模型的IP，而药企通常也会同意。

对于项目中产出的衍生数据和迭代模型，药企和AI制药公司对于后续的使用可能也有不同的需求。

例如，药企可能不希望合作项目中的衍生数据和专有知识被泄露或不当使用，尤其是用于服务竞争对手或用于开发竞争产品。与之相对地，出于业务灵活性的需求，AI制药公司可能希望将在项目中积累的知识和经验用于提升AI算法，从而更好地赋能将来的项目。

因此，药企与AI制药公司在充分理解各自的贡献和需求的基础上，可以协商对于衍生数据和迭代模型的所有权、使用权、使用范围、利益分享和使用限制等。例如，是否可以将迭代模型再利用（使用新数据再训练，重用模型等），是否仅可在自身业务范围内使用迭代模型，是否可以用于为第三方提供服务以及如何分配收益，是否限制模型拥有方擅自调整模型以转用于其他目的，以及是否限制将模型用于非预期目的或用于服务竞争对手或用于开发竞争产品等3。

2、潜在的IP风险在哪里

在关注项目产生的价值的同时，AI制药公司和药企还需要考虑项目中潜在的IP风险。

AI制药公司需考虑的风险例如

第三方数据：

AI算法的训练和使用都离不开数据，这可能包括外部数据（例如来自第三方的训练数据和来自药企的输入数据），并因此受到第三方和药企对这些外部数据在使用权益上的限制。

例如，如果AI制药公司使用的外部数据受第三方IP的保护（例如商业数据集），那么基于该外部数据获得的衍生数据，以及由此训练得到的AI模型可能也会受到该第三方IP的限制。AI制药公司应当与外部数据提供方明确外部数据及衍生数据的权属安排和使用限制，确保有权使用外部数据训练AI技术，并确保遵照约定的使用目的和使用范围来使用。

此外，如果外部数据本身侵犯他人合法权益，其衍生数据的权益可能受到影响。因此，在获取外部数据前，AI制药公司可以通过尽职调查，分析外部数据在内容和来源上的合规性，并要求数据提供方保证其提供的数据合法合规。

AI技术：

通常来说，虽然通过申请专利可以为AI软件或算法本身提供一些保护，但AI制药公司往往也同时需要依赖商业秘密以及著作权，以更全面地保护其AI软件或算法。然而，在与药企合作的过程中，AI制药公司有可能需要向药企披露其算法等核心商业秘密，因此需注意要求合作方对商业秘密采取足够的保密措施。

此外，AI软件可能部分基于现有的开源代码，但开源并不等于没有任何限制。开源代码的使用受开源协议的约束，不同的开源代码使用的开源协议可能不同，对商业化的约束也有所不同。例如预测蛋白结构的AlphaFold使用Apache 2.0许可，其许可用户进行商业化使用，并限制用户对许可的代码主张专利侵权4。另一种典型的许可是GPLv3，其中规定了“传染”条款，要求在开源代码基础上后续开发的衍生软件在涉及分发时应继续开源5。如果AI制药公司的AI技术同时包括GPLv3开源代码和私有代码，应考虑代码隔离，避免不期望开源的私有代码受到强制开源义务的影响。

对于药企而言

药企的专有数据通常属于商业秘密，应注意数据的保密性。在合作项目中，可以考虑约定在合同终止后，AI制药公司应销毁或删除药企提供的数据，并提交销毁或删除数据的书面证明。

此外，药企应当注意向外提供的数据的合规性，注意个人信息脱敏和跨境数据传输合规。结合《中华人民共和国数据安全法》，《中华人民共和国个人信息保护法》，未获得信息主体授权的，未匿名化的数据存在合规风险和侵权风险。根据《上海市数据条例》，侵害个人隐私的数据不得进行交易。关于人工智能在医疗领域的数据合规问题的详细介绍，请参考《君合法评丨人工智能与医疗健康产业系列研究之二：人工智能在医疗健康领域应用涉及的数据合规问题》。针对跨国合作中可能涉及的数据出境问题，可以参考《君合法评丨中国数据出境监管实务探讨》及《君合法评丨《数据出境安全评估申报指南（第一版）》正式发布》。

结语

与传统新药研发相比，AI制药带来了新的合作模式和新的项目产出。在AI制药合作项目中，双方应结合各自业务需要，规划相关知识产权的运用和保护，合理规避潜在的法律风险。

1. 参见《AI制药行业观察报告》第一章第三节，英矽智能.

2. 参见《AI制药行业观察报告》第一章第三节，英矽智能.

3.《Contract Guidelines on Utilization of AI and Data》，Ministry of Economy, Trade and Industry of Japan

4. https://github.com/deepmind/alphafold/blob/main/LICENSE

5. https://www.gnu.org/licenses/gpl-3.0.html 第5条