

引言
ChatGPT的火爆促使我们面对大量法律问题,其中包括了我们如何认定人工智能生成内容(AIGC生成物)的著作权,这不仅仅是目前ChatGPT将要面临的问题,更是整个AIGC产业需要面对的问题。本文将从ChatGPT的相关技术本身入手讨论AIGC生成物的可版权性以及提出目前法律体系下的AIGC生成物知识产权归属条款的建议。
一、ChatGPT与人工干预

人工智能可以追溯至上个世纪50年代计算机之父提出的图灵测试[1],其是通过使机器与人类进行相同的对话来判断机器是否具备了与人类相同的智力水准。而这之后计算机行业就已经开始了对对话式人工智能的开发,以期通过图灵测试。此时的人工智能还在使用模式匹配(Pattern Matching)[2]方式设计对话式机器人,它只需要提前设置人类可能提出的关键词,并且按照预设答案进行输出,现在很多的智能客服都还是使用这样的算法模式。
但随着模式匹配式算法受阻(很难通过图灵测试),图灵当时提出的另一个概念“机器学习”开始得到了不断的延伸,发展出了“监督学习”“无监督学习”“强化学习”“深度学习”等不同类型的机器学习方式,最终以“人工神经网络”的架构下对不同类型的机器学习方式进行结合。
而机器学习的学习能力,也伴随着Google的研究者于2017年在《Attention Is All You Need》一文中提出的Transformer模型,得到了指数级的学习速度的提升,目前ChatGPT的“T”说的就是Transformer。
ChatGPT的开发公司OpenAI公司2018年在Transformer模型的基础上,进一步研发了GPT(Generative Pre-trained Transformer),并且以此为基础推出了GPT、GPT-2、GPT-3、ChatGPT:
模型 | 发布时间 | 参数量 | 特点 |
GPT | 2018年6月 | 1.17亿 | 无监督学习(基本无需人类干预) |
GPT-2 | 2019年2月 | 15亿 | 使用无监督的预训练模型做有监督的任务 |
GPT-3 | 2020年5月 | 1750亿 | 海量参数 |
ChatGPT(基于2022年3月的GPT-3.5) | 2022年11月 | 1750亿(截止到2021年的数据) | 增加了“人工反馈强化学习”(增加了人工干预) |

OpenAI雇佣的40名人工训练员(labeler)对使用OpenAI的PlayGround的
人工训练员对第一阶段的模型自动生成的回复按照开发者既定的标准(例如相关性、富含信息性、有害信息等诸多标准)进行综合排序,训练奖励模型(RewordModel,RM);
使用RM作为强化学习的优化目标,利用PPO算法微调SFT模型。
二、中美AIGC生成物可版权性的探索[3]

目前基本大部分国家的著作权法都不认可除了人类以外其他的主体完成的创作可以适用著作权法获得保护,但人工智能的出现,以及其截止目前的不断发展,都使得各个国家的立法、司法在积极探讨AIGC生成物的著作权法项下的保护方式。其中的重要原因还在于,人类目前在人工智能中还起着非常重要的作用,以上面的ChatGPT技术发展过程为例:
人工智能训练过程中:人工智能开发过程中的“人工反馈强化学习”或者“人在回路”的人工干预的机器学习方式,使得AIGC生成物更像人类完成的创作,准确说更像进行了具体干预的那一个或者几个人类(人工训练员)完成的创作。例如现在ChatGPT的聊天回复风格,语言遣词造句都和人工反馈强化学习过程中的人工训练员的风格、遣词造句有着莫大的关联,那么这部分人类“创作”是否可以得到著作权法的认可?
用户使用过程中:用户在使用ChatGPT过程中,与ChatGPT的对话,促使它进行回复,所以ChatGPT的回复是用户与ChatGPT共同完成的结果,这部分真实人类用户的“提问”(创作),是否可以得到著作权法的认可?
用户使用AIGC生成物:除了ChatGPT以外,现在还有包括图形类、音乐类的AIGC产品,在AI完成“创作”之后,用户/使用者可以进一步对其生成物进行调整,这部分的人工干预的部分如何得到著作权法的认可?
由于上述人工智能存在的人工干预部分,因此存在着这部分人工创造以著作权法进行保护的讨论必要性,目前包括中国和美国都通过司法或者行政命令的方式在进行着这方面的探索:
1. 中国
对于AIGC生成物是否构成著作权法下的作品,中国法院存在下述两种截然相反的司法认定结论:北知案件中,法院认为,AI生成的文章不是自然人创作的,不构成有著作权的作品;在深圳南山案件中,法院认为,涉案AI生成文章产生的过程中,存在人工干预,构成有著作权的作品。
我们将继续关注各个国家对AIGC生成物的著作权法保护的尝试,期待可以早日找到AIGC生成物的权益保护与现行法律冲突的解决方案。
三、目前针对AIGC产品的知识产权归属条款建议

而目前囿于各个国家的法律基本上不认可AIGC生成物的可版权性,因此AIGC产品平台针对其AIGC生成物的知识产权归属通常是通过用户协议的方式进行明确的:


[1]图灵测试(英语:Turing test)是英国电脑科学家艾伦·图灵于1950年提出的思想实验,目的是测试机器能否表现出与人一样的智力水准。测试时测试者透过电脑键盘输入文本并透过屏幕输出文本。
[2] 模式匹配是数据结构中字符串的一种基本运算,给定一个子串,要求在某个字符串中找出与该子串相同的所有子串,这就是模式匹配。也就是给定一个词,然后可以调取一个已经设置好的预案。例如现在很多的银行、电商平台的客服机器人都是基于模式匹配完成的问题回复,问它一个订单的退货方式,他可以发出预设好的退货方式的介绍。
[3]在著作权法项下探讨任何创作形式的“可版权性”,前提一定是其具有“独创性”,不能是简单机械的复制、拍摄等的结果。当然目前AIGC生成的无论诗歌、图片、音乐,甚至是短小的视频都已经与人类完成的具有独创性的作品无异,因此我们探讨的前提是这部分具有独创性的AIGC生成物。
[4]该案件的认定逻辑也得到了最高院的支持,以及将其在WIPO会议上进行了说明。最高院法官在WIPO的发言稿:https://www.wipo.int/export/sites/www/about-ip/en/artificial_intelligence/conversation_ip_ai/pdf/ms_china_1_zh.pdf
[5]https://news.bloomberglaw.com/ip-law/ai-comic-art-dispute-leaves-copyright-protections-open-ended
植德元宇宙与数字经济
植德元宇宙与数字经济行业委员会,从元宇宙产业链、法律、商业模式等多角度出发,专注于研究元宇宙监管、区块链游戏、NFT、商业模式中的法律问题,为客户提供多维度的元宇宙法律服务,包括投融资、IPO、知识产权、合规(数据合规、刑事合规、税务合规、知识产权合规)等法律服务。
植德元宇宙与数字经济行业委员会由在不同合规专业领域具有行业、法律多重背景,且深耕多年的合伙人组成,擅长通过完整且动态的合规体系来协助元宇宙企业搭建合规制度,完善产品合规性,在事前、事中和事后多个环节进行风险防范或危机处理,结合商业化思维,协助客户做好合规审查和风险防控,为客户的经营活动保驾护航。
植德元宇宙与数字经济行业委员会
合伙人:郭晓兴、何京、李筠怡、时萧楠、汪闻超、王妍妍、王海青、杨诚、赵芸芸


合伙人 时萧楠
业务领域:知识产权、争议解决、政府监管与合规
010-56500937
xiaonan.shi@meritsandtree.com

