AI科技企业进行股权融资,投资人的尽职调查中,知识产权部分往往是最复杂、也是最容易出现让投资人打退堂鼓问题的领域。
AI企业的知识产权不只是专利,还涉及训练数据、算法模型、开源协议合规、以及开发人员的背景——这些问题如果不提前梳理,可能在尽调中暴露为估值风险或交割障碍。
AI企业知识产权的五个核心问题
问题一:核心技术的权属是否在公司
这是最基础的问题,也是最频繁出现问题的地方。
常见的权属风险:
创始人从前雇主带来的技术:如果公司的核心算法或模型,是创始人在前一家公司任职期间研发的,前雇主可能对该技术有知识产权主张。即便创始人已经离职,如果离职前未做好切割,原雇主可以主张职务发明归属,这是AI融资中最常见的隐雷之一。
技术仍登记在创始人个人名下:软件著作权、专利申请人是创始人个人,而非公司法人。投资人尽调时会发现,公司实际上不拥有核心资产。
联合创始人离开后未处理知识产权:早期有联合创始人参与研发,后来该创始人离开,但对公司代码库或核心算法的共同权利未做切割。
检查项:
- ☐ 所有核心技术(专利、软件著作权)登记在公司名下
- ☐ 创始人和核心技术员工均签署了《知识产权归属协议》(在职期间开发→归公司)
- ☐ 已离职的联合创始人对公司技术的权利主张,有书面的放弃或转让协议
问题二:训练数据的来源和合规性
AI模型依赖大量训练数据,但数据的来源合规性是投资人的核心关注点——这直接影响模型的可持续性和监管风险。
主要风险维度:
数据版权:训练数据是否包含有版权的内容(书籍、新闻、图片、代码)?未经授权使用有版权内容训练AI,可能面临版权侵权诉讼。这是目前全球AI公司面临的最主要的法律风险之一。
数据隐私:如果训练数据包含个人信息(如用户对话记录、个人行为数据),需要评估是否满足《个人信息保护法》的要求——包括数据收集时的授权、数据使用目的的限制、数据安全存储要求。
数据爬取:通过爬虫获取的数据,是否违反了数据来源平台的使用条款?在中国,非法爬取数据还可能涉及不正当竞争,甚至违反《网络安全法》。
检查项:
- ☐ 训练数据的来源清单(自有数据、购买数据、公开数据集、爬取数据)
- ☐ 购买数据的许可协议,确认许可范围覆盖AI训练用途
- ☐ 公开数据集的许可证类型(有些数据集明确禁止商业用途)
- ☐ 个人信息相关数据的隐私合规文件
问题三:开源软件的使用合规
很多AI企业的底层框架大量使用开源代码(如TensorFlow、PyTorch等),这通常没有问题。但部分开源库的许可证(License)对商业使用有限制,如果不注意,可能导致:
- 公司的核心代码必须以开源方式公开(这对商业秘密是灾难性的)
- 违反开源许可证,面临版权侵权
主要许可证类型及风险:
| 许可证 | 主要限制 | 商业风险 |
| MIT / Apache 2.0 | 几乎无限制 | 低 |
| LGPL | 链接时需要特别处理 | 中等 |
| GPL / AGPL | 修改版须开源,网络服务也触发(AGPL) | 高 |
| SSPL | 服务提供者须开源全部 | 很高 |
特别关注:部分大模型(如LLaMA系列早期版本)有商业使用限制,在许可证变化频繁的背景下,需要跟踪最新的许可条件。
检查项:
- ☐ 核心代码中使用的开源库清单
- ☐ 每个开源库的许可证类型
- ☐ GPL/AGPL类库的使用方式(是否触发”传染性”条款)
问题四:员工和顾问的保密与竞业安排
核心技术人员离职后能否带走技术或去竞争对手?
检查项:
- ☐ 所有技术员工的《保密协议》(NDA)
- ☐ 核心技术人员的《竞业限制协议》(非竞争期、范围、补偿)
- ☐ 外部顾问、合作机构的保密协议
- ☐ 离职员工的知识产权和保密义务处理
注意:竞业限制协议在中国需要支付补偿金才有效,且期限不得超过2年。没有支付补偿金的竞业限制,员工有权拒绝履行。补偿金标准各地不同:部分省市(如上海)规定每月不低于离职前月工资的30%;《劳动合同法》本身未设定全国统一比例,建议参照当地规定或协商约定合理金额。
问题五:AI监管合规——算法备案和大模型管理
2023年以来,中国出台了一系列AI专项监管法规:
- 《生成式人工智能服务管理暂行办法》:提供面向公众的生成式AI服务,需要向监管部门(网信办)完成备案
- 《互联网信息服务算法推荐管理规定》:算法推荐服务有相应备案要求
- 《深度合成服务管理规定》:涉及深度合成(换脸、合成音频等)的服务有备案要求
这些备案要求不只是”表格填填”,还涉及安全评估、内容管理机制的建立。投资人会核查企业的AI服务是否已完成必要备案,未备案的商业化服务面临下架或处罚风险。
融资前的知识产权整改优先级
| 问题 | 紧迫性 | 难度 |
| 技术权属未在公司名下 | 最高 | 中等(转让手续) |
| 创始人前雇主的潜在主张 | 高 | 高(需要评估并可能需要谈判) |
| 开源许可证违规 | 高 | 高(可能需要重写代码) |
| 训练数据合规 | 高 | 中等(取决于数据来源) |
| 员工NDA/竞业不完整 | 中等 | 低(补签即可) |
| AI监管备案未完成 | 中等 | 中等(视具体服务类型) |
真实案例参考
某AI语音识别公司准备进行B轮融资。蔡律师协助进行融资前知识产权梳理,发现:公司核心算法的专利申请人是联合创始人个人而非公司(联合创始人已离职);训练数据集中包含了从某音频平台爬取的内容,该平台的用户协议明确禁止爬取;两名核心工程师未签署保密协议。整改措施:与已离职联合创始人协商,完成专利权属转让至公司(支付了象征性对价);停止使用爬取数据集并重新采购合规授权数据;补签全员保密协议。整改耗时约6周,B轮顺利完成,投资人未就知识产权提出重大异议。
→ 查看代表案例
常见问题
AI公司的算法可以申请专利吗?
纯粹的数学方法或算法本身通常不能申请专利(属于智力活动规则,不具有可专利性)。但如果算法与具体的技术应用结合(如”一种用于语音识别的神经网络训练方法及其实现装置”),可以以发明专利申请,且近年来AI相关专利申请的授权率在提高。建议由专业的专利律师评估具体算法的可专利性,并考虑专利布局策略。
公司用了AGPL开源库的代码,现在发现问题了,怎么补救?
AGPL的”传染性”非常强——如果你基于AGPL代码提供网络服务,你的全部代码都应当以AGPL开源。补救方案取决于具体用法:如果AGPL代码只是工具类使用(独立运行,不与你的代码混合),可能不触发传染;如果已经深度嵌入,可能需要重写该功能模块,替换成MIT/Apache许可的替代方案。这需要由代码审计专家和律师共同评估,越早处理越好。
怎么证明我们的技术是独立开发的,不是从前雇主那里带过来的?
证明独立开发的核心证据:研发过程中的代码提交记录(Git历史、开发日志);研发时间线(证明关键技术是在创始人加入公司后才开始开发,而不是在前雇主任职期间);技术路径的差异性(你的实现方法与前雇主不同);创始人在前雇主的工作范围(如果创始人在前雇主负责的是销售,而非核心技术研发,则主张更弱)。建议由律师评估风险,必要时准备声明文件,让前雇主出具”不主张知识产权”的确认函。
公司尚未完成AI备案,但投资人已经感兴趣,是否应该先融资再备案?
不建议在明知未合规的情况下融资——投资人的尽调通常会发现监管合规状态,如果在融资时未主动披露,后续可能被认定为信息不实,影响投资协议的执行。更好的做法是主动披露备案状态,同时给出备案时间表,将备案完成作为交割前提条件之一,或者在投资后保护条款中约定备案期限。部分投资人可以接受”进行中”的备案状态,关键是透明度。
AI企业准备融资,需要知识产权合规梳理?
蔡龙秋律师,浙江金道律师事务所,专注科技企业融资合规、知识产权权属整理及AI监管应对。
可协助AI企业在融资前完成知识产权尽调准备,以及处理技术权属、开源合规等复杂问题。
→ 查看代表案例
联系方式:186-6710-5686(电话 / 微信同号)
有类似问题?欢迎预约一对一评估
蔡律师结合您的具体情况,给出清晰可行的法律路径