AI科技企业进行股权融资,投资人的尽职调查中,知识产权部分往往是最复杂、也是最容易出现让投资人打退堂鼓问题的领域。

AI企业的知识产权不只是专利,还涉及训练数据、算法模型、开源协议合规、以及开发人员的背景——这些问题如果不提前梳理,可能在尽调中暴露为估值风险或交割障碍。


AI企业知识产权的五个核心问题

问题一:核心技术的权属是否在公司

这是最基础的问题,也是最频繁出现问题的地方。

常见的权属风险:

创始人从前雇主带来的技术:如果公司的核心算法或模型,是创始人在前一家公司任职期间研发的,前雇主可能对该技术有知识产权主张。即便创始人已经离职,如果离职前未做好切割,原雇主可以主张职务发明归属,这是AI融资中最常见的隐雷之一。

技术仍登记在创始人个人名下:软件著作权、专利申请人是创始人个人,而非公司法人。投资人尽调时会发现,公司实际上不拥有核心资产。

联合创始人离开后未处理知识产权:早期有联合创始人参与研发,后来该创始人离开,但对公司代码库或核心算法的共同权利未做切割。

检查项:

  • ☐ 所有核心技术(专利、软件著作权)登记在公司名下
  • ☐ 创始人和核心技术员工均签署了《知识产权归属协议》(在职期间开发→归公司)
  • ☐ 已离职的联合创始人对公司技术的权利主张,有书面的放弃或转让协议

问题二:训练数据的来源和合规性

AI模型依赖大量训练数据,但数据的来源合规性是投资人的核心关注点——这直接影响模型的可持续性和监管风险。

主要风险维度:

数据版权:训练数据是否包含有版权的内容(书籍、新闻、图片、代码)?未经授权使用有版权内容训练AI,可能面临版权侵权诉讼。这是目前全球AI公司面临的最主要的法律风险之一。

数据隐私:如果训练数据包含个人信息(如用户对话记录、个人行为数据),需要评估是否满足《个人信息保护法》的要求——包括数据收集时的授权、数据使用目的的限制、数据安全存储要求。

数据爬取:通过爬虫获取的数据,是否违反了数据来源平台的使用条款?在中国,非法爬取数据还可能涉及不正当竞争,甚至违反《网络安全法》。

检查项:

  • ☐ 训练数据的来源清单(自有数据、购买数据、公开数据集、爬取数据)
  • ☐ 购买数据的许可协议,确认许可范围覆盖AI训练用途
  • ☐ 公开数据集的许可证类型(有些数据集明确禁止商业用途)
  • ☐ 个人信息相关数据的隐私合规文件

问题三:开源软件的使用合规

很多AI企业的底层框架大量使用开源代码(如TensorFlow、PyTorch等),这通常没有问题。但部分开源库的许可证(License)对商业使用有限制,如果不注意,可能导致:

  • 公司的核心代码必须以开源方式公开(这对商业秘密是灾难性的)
  • 违反开源许可证,面临版权侵权

主要许可证类型及风险:

许可证 主要限制 商业风险
MIT / Apache 2.0 几乎无限制
LGPL 链接时需要特别处理 中等
GPL / AGPL 修改版须开源,网络服务也触发(AGPL)
SSPL 服务提供者须开源全部 很高

特别关注:部分大模型(如LLaMA系列早期版本)有商业使用限制,在许可证变化频繁的背景下,需要跟踪最新的许可条件。

检查项:

  • ☐ 核心代码中使用的开源库清单
  • ☐ 每个开源库的许可证类型
  • ☐ GPL/AGPL类库的使用方式(是否触发”传染性”条款)

问题四:员工和顾问的保密与竞业安排

核心技术人员离职后能否带走技术或去竞争对手?

检查项:

  • ☐ 所有技术员工的《保密协议》(NDA)
  • ☐ 核心技术人员的《竞业限制协议》(非竞争期、范围、补偿)
  • ☐ 外部顾问、合作机构的保密协议
  • ☐ 离职员工的知识产权和保密义务处理

注意:竞业限制协议在中国需要支付补偿金才有效,且期限不得超过2年。没有支付补偿金的竞业限制,员工有权拒绝履行。补偿金标准各地不同:部分省市(如上海)规定每月不低于离职前月工资的30%;《劳动合同法》本身未设定全国统一比例,建议参照当地规定或协商约定合理金额。

问题五:AI监管合规——算法备案和大模型管理

2023年以来,中国出台了一系列AI专项监管法规:

  • 《生成式人工智能服务管理暂行办法》:提供面向公众的生成式AI服务,需要向监管部门(网信办)完成备案
  • 《互联网信息服务算法推荐管理规定》:算法推荐服务有相应备案要求
  • 《深度合成服务管理规定》:涉及深度合成(换脸、合成音频等)的服务有备案要求

这些备案要求不只是”表格填填”,还涉及安全评估、内容管理机制的建立。投资人会核查企业的AI服务是否已完成必要备案,未备案的商业化服务面临下架或处罚风险。


融资前的知识产权整改优先级

问题 紧迫性 难度
技术权属未在公司名下 最高 中等(转让手续)
创始人前雇主的潜在主张 高(需要评估并可能需要谈判)
开源许可证违规 高(可能需要重写代码)
训练数据合规 中等(取决于数据来源)
员工NDA/竞业不完整 中等 低(补签即可)
AI监管备案未完成 中等 中等(视具体服务类型)

真实案例参考

某AI语音识别公司准备进行B轮融资。蔡律师协助进行融资前知识产权梳理,发现:公司核心算法的专利申请人是联合创始人个人而非公司(联合创始人已离职);训练数据集中包含了从某音频平台爬取的内容,该平台的用户协议明确禁止爬取;两名核心工程师未签署保密协议。整改措施:与已离职联合创始人协商,完成专利权属转让至公司(支付了象征性对价);停止使用爬取数据集并重新采购合规授权数据;补签全员保密协议。整改耗时约6周,B轮顺利完成,投资人未就知识产权提出重大异议。

查看代表案例


常见问题

AI公司的算法可以申请专利吗?

纯粹的数学方法或算法本身通常不能申请专利(属于智力活动规则,不具有可专利性)。但如果算法与具体的技术应用结合(如”一种用于语音识别的神经网络训练方法及其实现装置”),可以以发明专利申请,且近年来AI相关专利申请的授权率在提高。建议由专业的专利律师评估具体算法的可专利性,并考虑专利布局策略。

公司用了AGPL开源库的代码,现在发现问题了,怎么补救?

AGPL的”传染性”非常强——如果你基于AGPL代码提供网络服务,你的全部代码都应当以AGPL开源。补救方案取决于具体用法:如果AGPL代码只是工具类使用(独立运行,不与你的代码混合),可能不触发传染;如果已经深度嵌入,可能需要重写该功能模块,替换成MIT/Apache许可的替代方案。这需要由代码审计专家和律师共同评估,越早处理越好。

怎么证明我们的技术是独立开发的,不是从前雇主那里带过来的?

证明独立开发的核心证据:研发过程中的代码提交记录(Git历史、开发日志);研发时间线(证明关键技术是在创始人加入公司后才开始开发,而不是在前雇主任职期间);技术路径的差异性(你的实现方法与前雇主不同);创始人在前雇主的工作范围(如果创始人在前雇主负责的是销售,而非核心技术研发,则主张更弱)。建议由律师评估风险,必要时准备声明文件,让前雇主出具”不主张知识产权”的确认函。

公司尚未完成AI备案,但投资人已经感兴趣,是否应该先融资再备案?

不建议在明知未合规的情况下融资——投资人的尽调通常会发现监管合规状态,如果在融资时未主动披露,后续可能被认定为信息不实,影响投资协议的执行。更好的做法是主动披露备案状态,同时给出备案时间表,将备案完成作为交割前提条件之一,或者在投资后保护条款中约定备案期限。部分投资人可以接受”进行中”的备案状态,关键是透明度。


AI企业准备融资,需要知识产权合规梳理?

蔡龙秋律师,浙江金道律师事务所,专注科技企业融资合规、知识产权权属整理及AI监管应对。

可协助AI企业在融资前完成知识产权尽调准备,以及处理技术权属、开源合规等复杂问题。

查看代表案例

联系方式:186-6710-5686(电话 / 微信同号)

有类似问题?欢迎预约一对一评估

蔡律师结合您的具体情况,给出清晰可行的法律路径

免费预约咨询
← 返回全部文章 查看代表案例 →