AI科技企业融资前，知识产权尽调要查哪些——蔡律师实务解析

AI科技企业进行股权融资，投资人的尽职调查中，知识产权部分往往是最复杂、也是最容易出现让投资人打退堂鼓问题的领域。

AI企业的知识产权不只是专利，还涉及训练数据、算法模型、开源协议合规、以及开发人员的背景——这些问题如果不提前梳理，可能在尽调中暴露为估值风险或交割障碍。

AI企业知识产权的五个核心问题

问题一：核心技术的权属是否在公司

这是最基础的问题，也是最频繁出现问题的地方。

常见的权属风险：

创始人从前雇主带来的技术：如果公司的核心算法或模型，是创始人在前一家公司任职期间研发的，前雇主可能对该技术有知识产权主张。即便创始人已经离职，如果离职前未做好切割，原雇主可以主张职务发明归属，这是AI融资中最常见的隐雷之一。

技术仍登记在创始人个人名下：软件著作权、专利申请人是创始人个人，而非公司法人。投资人尽调时会发现，公司实际上不拥有核心资产。

联合创始人离开后未处理知识产权：早期有联合创始人参与研发，后来该创始人离开，但对公司代码库或核心算法的共同权利未做切割。

检查项：

☐ 所有核心技术（专利、软件著作权）登记在公司名下
☐ 创始人和核心技术员工均签署了《知识产权归属协议》（在职期间开发→归公司）
☐ 已离职的联合创始人对公司技术的权利主张，有书面的放弃或转让协议

问题二：训练数据的来源和合规性

AI模型依赖大量训练数据，但数据的来源合规性是投资人的核心关注点——这直接影响模型的可持续性和监管风险。

主要风险维度：

数据版权：训练数据是否包含有版权的内容（书籍、新闻、图片、代码）？未经授权使用有版权内容训练AI，可能面临版权侵权诉讼。这是目前全球AI公司面临的最主要的法律风险之一。

数据隐私：如果训练数据包含个人信息（如用户对话记录、个人行为数据），需要评估是否满足《个人信息保护法》的要求——包括数据收集时的授权、数据使用目的的限制、数据安全存储要求。

数据爬取：通过爬虫获取的数据，是否违反了数据来源平台的使用条款？在中国，非法爬取数据还可能涉及不正当竞争，甚至违反《网络安全法》。

检查项：

☐ 训练数据的来源清单（自有数据、购买数据、公开数据集、爬取数据）
☐ 购买数据的许可协议，确认许可范围覆盖AI训练用途
☐ 公开数据集的许可证类型（有些数据集明确禁止商业用途）
☐ 个人信息相关数据的隐私合规文件

问题三：开源软件的使用合规

很多AI企业的底层框架大量使用开源代码（如TensorFlow、PyTorch等），这通常没有问题。但部分开源库的许可证（License）对商业使用有限制，如果不注意，可能导致：

公司的核心代码必须以开源方式公开（这对商业秘密是灾难性的）
违反开源许可证，面临版权侵权

主要许可证类型及风险：

许可证	主要限制	商业风险
MIT / Apache 2.0	几乎无限制	低
LGPL	链接时需要特别处理	中等
GPL / AGPL	修改版须开源，网络服务也触发（AGPL）	高
SSPL	服务提供者须开源全部	很高

特别关注：部分大模型（如LLaMA系列早期版本）有商业使用限制，在许可证变化频繁的背景下，需要跟踪最新的许可条件。

检查项：

☐ 核心代码中使用的开源库清单
☐ 每个开源库的许可证类型
☐ GPL/AGPL类库的使用方式（是否触发”传染性”条款）

问题四：员工和顾问的保密与竞业安排

核心技术人员离职后能否带走技术或去竞争对手？

检查项：

☐ 所有技术员工的《保密协议》（NDA）
☐ 核心技术人员的《竞业限制协议》（非竞争期、范围、补偿）
☐ 外部顾问、合作机构的保密协议
☐ 离职员工的知识产权和保密义务处理

注意：竞业限制协议在中国需要支付补偿金才有效，且期限不得超过2年。没有支付补偿金的竞业限制，员工有权拒绝履行。补偿金标准各地不同：部分省市（如上海）规定每月不低于离职前月工资的30%；《劳动合同法》本身未设定全国统一比例，建议参照当地规定或协商约定合理金额。

问题五：AI监管合规——算法备案和大模型管理

2023年以来，中国出台了一系列AI专项监管法规：

《生成式人工智能服务管理暂行办法》：提供面向公众的生成式AI服务，需要向监管部门（网信办）完成备案
《互联网信息服务算法推荐管理规定》：算法推荐服务有相应备案要求
《深度合成服务管理规定》：涉及深度合成（换脸、合成音频等）的服务有备案要求

这些备案要求不只是”表格填填”，还涉及安全评估、内容管理机制的建立。投资人会核查企业的AI服务是否已完成必要备案，未备案的商业化服务面临下架或处罚风险。

融资前的知识产权整改优先级

问题	紧迫性	难度
技术权属未在公司名下	最高	中等（转让手续）
创始人前雇主的潜在主张	高	高（需要评估并可能需要谈判）
开源许可证违规	高	高（可能需要重写代码）
训练数据合规	高	中等（取决于数据来源）
员工NDA/竞业不完整	中等	低（补签即可）
AI监管备案未完成	中等	中等（视具体服务类型）

真实案例参考

某AI语音识别公司准备进行B轮融资。蔡律师协助进行融资前知识产权梳理，发现：公司核心算法的专利申请人是联合创始人个人而非公司（联合创始人已离职）；训练数据集中包含了从某音频平台爬取的内容，该平台的用户协议明确禁止爬取；两名核心工程师未签署保密协议。整改措施：与已离职联合创始人协商，完成专利权属转让至公司（支付了象征性对价）；停止使用爬取数据集并重新采购合规授权数据；补签全员保密协议。整改耗时约6周，B轮顺利完成，投资人未就知识产权提出重大异议。

→ 查看代表案例

常见问题

AI公司的算法可以申请专利吗？

纯粹的数学方法或算法本身通常不能申请专利（属于智力活动规则，不具有可专利性）。但如果算法与具体的技术应用结合（如”一种用于语音识别的神经网络训练方法及其实现装置”），可以以发明专利申请，且近年来AI相关专利申请的授权率在提高。建议由专业的专利律师评估具体算法的可专利性，并考虑专利布局策略。

公司用了AGPL开源库的代码，现在发现问题了，怎么补救？

AGPL的”传染性”非常强——如果你基于AGPL代码提供网络服务，你的全部代码都应当以AGPL开源。补救方案取决于具体用法：如果AGPL代码只是工具类使用（独立运行，不与你的代码混合），可能不触发传染；如果已经深度嵌入，可能需要重写该功能模块，替换成MIT/Apache许可的替代方案。这需要由代码审计专家和律师共同评估，越早处理越好。

怎么证明我们的技术是独立开发的，不是从前雇主那里带过来的？

证明独立开发的核心证据：研发过程中的代码提交记录（Git历史、开发日志）；研发时间线（证明关键技术是在创始人加入公司后才开始开发，而不是在前雇主任职期间）；技术路径的差异性（你的实现方法与前雇主不同）；创始人在前雇主的工作范围（如果创始人在前雇主负责的是销售，而非核心技术研发，则主张更弱）。建议由律师评估风险，必要时准备声明文件，让前雇主出具”不主张知识产权”的确认函。

公司尚未完成AI备案，但投资人已经感兴趣，是否应该先融资再备案？

不建议在明知未合规的情况下融资——投资人的尽调通常会发现监管合规状态，如果在融资时未主动披露，后续可能被认定为信息不实，影响投资协议的执行。更好的做法是主动披露备案状态，同时给出备案时间表，将备案完成作为交割前提条件之一，或者在投资后保护条款中约定备案期限。部分投资人可以接受”进行中”的备案状态，关键是透明度。

AI企业准备融资，需要知识产权合规梳理？

蔡龙秋律师，浙江金道律师事务所，专注科技企业融资合规、知识产权权属整理及AI监管应对。

可协助AI企业在融资前完成知识产权尽调准备，以及处理技术权属、开源合规等复杂问题。

→ 查看代表案例

联系方式：186-6710-5686（电话 / 微信同号）

有类似问题？欢迎预约一对一评估

蔡律师结合您的具体情况，给出清晰可行的法律路径

免费预约咨询