近期,生成式人工智能的广泛流行引发了诸多著作权法相关的讨论。在生成式人工智能生成的海量内容中,不乏富有独创性的表达。例如,使用者可以输入特定数量的关键词,要求生成式人工智能运用特定词汇元素,串联形成一篇完整的小说。结果表明,生成式人工智能不但没有将特定元素进行简单拼接,还通过一定的逻辑层次形成了具有一定立意和主题文学色彩的“作品”。生成式人工智能在“创作”方面的高超能力引发了业界的关注。对于人工智能生成内容的著作权法讨论,首要前提是明晰其生成内容是否具有落入著作权法保护范畴的可能,这也回归到近年来对人工智能生成内容著作权法研究的基础论题。
界定创作主体
我国著作权法规定,作品是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。根据关于作品构成要件的规定,著作权法保护的作品离不开创作的主体,而创作主体因素表现为对作品独创性的贡献以及智力成果的投入。从著作权法的文义解释出发,智力成果因素暗含了作品创作主体的自然人属性,即离不开自然人思想、情感等智力活动对作品创作的投入。从国际层面来看,《保护文学和艺术作品伯尔尼公约》将自然人作为作品创作的主体,由此形成了公约规则体系的基础。对于生成式人工智能系统而言,在生成内容中若完全缺乏人类活动产生的创造性投入,难以将其界定为著作权法保护的客体。
在生成式人工智能运行过程中是否完全没有人类的智力活动投入,是需要进一步探讨的问题。对生成式人工智能模型运作分析,其中显然离不开自然人的智力活动投入。从生成过程角度看,生成内容包含了初始端技术开发人员对模型的程序设计以及模拟人工神经网络的不断强化学习、演练,还有使用端使用主体对语料库的提问、调用和引导式修正。通过多方自然人主体的共同努力,才使得生成式人工智能达到逻辑清晰、表达独到的结果,并且随着互动次数增加,生成式人工智能还可以不断更新、完善数据库。由此可见,生成式人工智能的“创作”过程并非完全由该模型主导。事实上,当前人工智能模型的发展并未达到拥有自主意识的强人工智能阶段。由此看来,生成内容有可能成为著作权法保护的作品。
具有独创内容
对于生成式人工智能生成内容的可著作权性界定,其核心要件依然是生成内容的独创性表征。作为作品的重要构成要件,独创性的界定和标准历来存在争议。通过法解释论剖析独创性的本质,其包含“独”与“创”两大要素。前者强调生成内容需为创作主体独立创作完成,排除对他人创作作品的单纯复制、剽窃、抄袭,要求生成内容在客观层面与既有成果存在差异性,不能构成实质性相似;对于后者,无论采取创造性的有无或高低标准,该要素都要求受著作权法保护的作品在客观层面至少存在与既有表达不同的创造性表达。
结合前述对创作主体的要求,对生成式人工智能生成内容可著作权性的判断,进一步可限缩为其中人类智力活动投入是否产生独创性的判断。从生成式人工智能的程序设计端来看,生成式人工智能生成具有创造力的表达离不开对语言模型的程序设计与安排。生成式人工智能之所以能够生成大量表达,离不开前期海量的数据输入,输入数据量越大,生成式人工智能的“智能性”也越强。由此可知,程序的设计与开发主要是从数据的调动运用层面辅助生成创造性表述,其生成内容创造性的直接来源主要为从公共领域甚至是受著作权保护领域学习的海量语言资源。
加大智力投入
从生成式人工智能的使用端来看,关键在于当前使用主体的使用行为是否能直接产生创造性的智力投入。梳理总结当前对生成式人工智能的应用实践,使用者促使生成式人工智能产生创造性的表达主要包括以下情形:一是直接向生成式人工智能提出某种“创作”要求,如作一首诗歌、编写一段程序;二是向生成式人工智能提供部分元素,要求其依据所给元素完成创作等;三是采取递进式的引导性提问,一步步优化回复的逻辑与表述。就前述第一、二种使用情形而言,尽管创造性表达的发起者为自然人主体,但实际上,使用者很难对最终生成内容的创造性表达产生实质影响,生成内容所运用的词汇、句式及语言风格等,均是生成式人工智能从前期学习的数据资源调用的结果。
司法实践中,有法院曾认为生成式人工智能程序使用者仅进行关键词输入与检索,没有产生凝结其思想、感情的独创性表达,不宜认定为作品。就前述第三种使用情形而言,由于使用者互动性投入增多,在生成式人工智能根据提问反复进行的优化学习和输出过程中,生成内容中使用主体原始输入的影响程度不断上升,占比逐渐增加,使用者有可能对生成内容创造性产生直接的实质影响。
生成式人工智能生成内容的可著作权性界定,需要回溯著作权制度的理论根基,严格围绕作品构成要件的本质要求进行判断。无论是劳动财产论还是激励理论,都充分肯定了创作主体的人本属性。当前,生成式人工智能生成的“作品”本质上仍离不开人类思维的掌控和思想情感的赋予,可著作权性界定的前置要件为人类智力成果的投入,而生成式人工智能本身不具备创作主体的资质。在人类智力活动投入的基础上,进而需要判断具体生成内容的独创性。生成式人工智能的生成内容主要来源于其前期对于海量语言数据资源的机器学习,特定的创造性表达与程序设计开发者并无直接关联,而使用者的使用行为也主要限于对其语言数据库的调取应用,多数情形下并未付出直接的创造性投入。因此,生成式人工智能的生成内容大多并非人类智力活动直接产生的创造性成果。但是,不能完全排除生成式人工智能生成内容的可著作权性,在人类创造性活动的持续加注下,也可能产生各类符合著作权法要求的作品。
网站备案号2