AI与画家智财诉讼案例系列2:画家控诉DeviantArt生成式AI著作侵权首轮程序判决被告
占上风
原文连结:
https://bit.ly/4bSKBdT
原文:
本案系由美国三位艺术家于2023年1月,对Stability AI公司开发的DreamStudio、
Midjourney公司开发的Midjourney以及DeviantArt公司开发的DreamUp等生成式AI工具,
向北加州联邦地院提告著作侵权[1],业经法院于2023年10月底做出中间判决性质之程序
裁定。虽然许多待证事项,要到证据开示的阶段才会逐步浮现,但中间程序判决仍有其重
要性,因为针对其中重要的法律争议问题,法官多少会流露出其心证,因此仍具参考价值
。本刊之前已介绍Stability AI部分请参本刊美国画家控告Stability AI生成式AI工具著
作侵权之程序判决出炉,本文续行分析DeviantArt。
本案涉及之DreamUp产品
被告DeviantArt系一成立于2000年的美国徳拉瓦州公司,主要以“线上社群”闻名,可供
数位艺术家在其平台分享作品、交流的社交服务网站。2022年11月它发布DreamUp产品,
系依赖稳定扩散(Stable Diffusion)产生图像,提供给付费的客户。原告声称,至少有一
个LAION数据集被纳入稳定扩散用于训练图像(“美术数据集”aesthetic dataset),其
透过抓取100个包括DeviantArt在内网站资料建构数据集。因此,原告指控同案被告
Stability AI从DeviantArt网站,复制可能百万的训练图像,这些图像是由DeviantArt的
订阅者所建立,但都是未获得授权之作品。原告声称,DeviantArt将DreamUp和稳定扩散
纳入其网站,已违反其自身的服务条款,该条款禁止未经同意将内容用于商业目的。
原告对DeviantArt 的直接侵权指控
原告提出关于DeviantArt直接侵权的三种理论:
(1) 透过发行包含训练图像压缩副本的稳定扩散,作为其DreamUp产品AI图像产品的一部
分,进行直接侵权;
(2) 透过建立和发行本身就是侵权之衍生著作的DreamUp商品,进行直接侵权;以及
(3) 生成和发行侵权之衍生作品的输出图像。
为了支持此主张,原告指出:DreamUp是一款基于网络的应用程式(web-based app),可根
据文本提示(text prompts)产生图像。与同案被告Stability AI之DreamStudio产品一样
,DreamUp也依赖Stability AI的稳定扩散软件,作为其底层软件引擎来生成图像,该稳
定扩散被用在DreamUp内的“软件库”。DeviantArt透过DreamUp应用程式,将稳定扩散纳
入其网站;原告并引述DeviantArt执行长的话:“DeviantArt决定使用稳定扩散,因为它
是我们采用开源软件引擎并对其“修改”的唯一选择。”
针对原告起诉中指控稳定扩散中包含关于“训练图像嵌入和储存的压缩副本”,主张被告
AI工具输出图像,包含接受训练之受著作权保护作品的压缩副本,所以是衍生作品,并声
称该训练数据集系由50亿张图像组成,DeviantArt对此强烈反驳,认为这是不合理而难以
置信的;因为庞大的图像数量,不可能被压缩到一个可执行的程式中。
法院认为“压缩副本”需进一步明确定义
就直接侵权的第一个理论,原告指控被告稳定扩散包含训练图像的“压缩副本”,且
DreamUp产品使用这些压缩副本,而该稳定扩散包含已注册作品的压缩副本,但起诉状却
另对扩散之运作描述成:“因为一个经过训练的扩散模型,可产生其训练图像中的任何一
个副本(这些图像数量可能达到数十亿),所以扩散模型可被视为储存这些图像副本的另
一种形式。实质上,这类似于在电脑上拥有一个包含数十亿个JPEG图像档案的目录,但扩
散模型使用统计和数学方法,可以更有效和压缩的方式来储存这些图像”。DeviantArt抗
辩原告此种论调不清楚且不合理,法院认为正确。
法院认为,原告关于“压缩副本”的指控,与起诉状中对扩散模型运作过程的描述相矛盾
,因原告已承认扩散过程不涉及图像复制,而是应用数学方程式和算法,从训练图像中
捕获概念。因此法院同意被告观点,要求原告修改起诉状,以厘清其关于训练图像的压缩
副本理论,并提供相关事实以支持稳定扩散(至少部分为开源程式[2])如何操作训练图
像。如果原告主张稳定扩散包含训练图像的“压缩副本”,则其需明确定义这些所谓的“
压缩副本”为何,并提供合理的事实;如果原告的压缩副本理论,是基于稳定扩散包含可
透过算法或指令执行的数学或统计方法,以便全部或部分重建训练图像来创造新的输出
图像,则原告需澄清并提供合理的事实来支持。
法院指示原告如何“修改”稳定扩散及压缩副本之主张
法院表示,视将来起诉状可能修改指控的事实而定,但DeviantArt可能会对直接侵权主张
进行更具针对性的攻击。例如,不清楚的是,稳定扩散是否仅包括可应用于建立图像的演
算法和指令,而这些图像只含有受著作权保护之训练图像的一小部分元素(a few
elements);如DeviantArt仅透过其应用程式和网站,将稳定扩散作为“文库”(library)
提供客户存取使用,则其为何需要对直接侵权负责?凡此种种都还不确定。然而,法院似
未完全排除原告可辩护这一指控的可能性,指出如果原告能合理主张,被告AI产品可让使
用者,透过明确引用原告姓名的作品来创作新作品,且原告受保护的内容究竟如何,以及
有多少留在稳定扩散中或系被AI最终产品所使用,则其立论可能更坚强。
再者,原告虽引用DeviantArt执行长的说词,其指出DeviantArt使用稳定扩散,是因为
Stability AI允许DeviantArt“修改”稳定扩散。但问题在于,原告迄未指控这些修改是
什么?或者是,在稳定扩散的结构下,为何于使用DreamUp时,稳定扩散中可能存有受着
作权保护作品的压缩副本,而被DeviantArt或其使用者复制的事实。原告迄亦未提供,当
使用者透过应用程式或DeviantArt的网站造访DreamUp时,关于DeviantArt对其使用者“
发行”稳定扩散之合理指控。凡此,都待原告进一步阐明。
至于原告对直接侵权的第二个理论,即稳定扩散是一个“衍生作品”,因其包含数十亿张
受著作权保护图像的压缩复本,并透过将稳定扩散合并纳入到DreamUp中,DeviantArt对
基于原告作品而“改造”(transformed)所产生的作品应负起责任,这种理论因以上相同
理由亦不被法院认可。
法院判定主张“输出图像”系侵权之衍生作品需建构“实质相似性”
就原告的第三个直接侵权理论,即DreamUp生成的“输出图像”皆属于侵权的衍生作品。
DeviantArt抗辩,为了充分支持这点,原告必须主张输出图像与受保护作品具有实质相似
性(substantially similar),但原告却无法如此主张,因为原告自己在起诉状中已承认
:“根据扩散过程的运作原理,一般而言,对于特定文本指令提示所回应产生由稳定扩散
输出的图像,不太可能与训练数据中的任何特定图像互相匹配而相似(close match)”;
参Skidmore as Tr. for Randy Craig Wolfe Tr. v. Led Zeppelin, 952 F.3d 1051,
1064 (9th Cir. 2020)(该案法院认为“非法盗用的特点,是作品之间需存在实质相似性
”)[3]。
原告遂辩称,根据Range Rd. Music, Inc. v. E. Coast Foods, Inc. (9th Cir. 2012)
案例,不需要去处理“实质相似性”问题。该案涉及透过光盘播放受著作权保护的音乐并
现场表演的指控,该案中法院认定,证明“实质相似性”是无关紧要的,因为音乐公司所
提供的证据,已足以证明公开表演对受著作权保护作品的直接复制。而“实质相似性”的
展现,仅在缺乏直接复制证据的情况下,才是证明侵权所需,但如有直接复制之证据就不
需“实质相似性”;另参Narell v. Freeman, 872 F.2d 907, 910 (9th Cir.1989)(该
案法院指出,当被告实际上复制原告整个作品时,法院将作出“被告复制原告作品的判断
,而不需进行“实质相似性”的分析”)。
原告依赖以上案例主张,其受著作权保护作品的所有元素,都被全盘复制为训练图像,因
此输出图像必然是衍生作品,并指出因为系统的每个输出图像,都完全源自潜在图像
(latent images)请参本刊美国画家控告Stability AI生成式AI工具著作侵权之程序判决
出炉,而这些潜在图像是受著作权保护图像的副本。基于此,每个混合图像必然是衍生作
品。但本案法官否定此一看法,认为本案和Range Road案中的全盘复制和表演不同,有关
压缩副本和DeviantArt复制的理论需要澄清,并须有可信事实的充分支持。而且原告的另
一个问题是,每一个用于训练稳定扩散的训练图像都拥有著作权,或者所有DeviantArt之
使用者的输出图像,都依赖受著作权保护的训练图像,因此所有使用稳定扩散输出图像,
均构成用于训练稳定扩散图像之侵权的衍生作品,这些主张都不合理。
法院援引“衍生作品”与“实质相似性”案例
针对训练图像所生成的输出图像,法院不同意基于衍生理论的著作权主张,可以在缺乏“
实质相似性”指控的情况下存在。法院认为,被指控侵权的“衍生作品”仍必须与原作具
有一定的相似性,或包含原作品受保护的元素。法院援引4个案例来说明:
1. Jarvis v. K2 Inc., 486 F.3d 526, 532 (9th Cir. 2007)
判定为衍生作品,原告以某种形式提供图像予被告,随后这些图像以完全不同但仍可辨认
的形式应用于拼贴广告中。该广告并非仅是简单地编辑或收集原告的图像,而是以多种方
式修改,并将它与其他图像和艺术元素融合成新作品,这些作品系基于原告之原始图像所
衍生出的新作品。
2. ITC Textile Ltd. v. Wal-Mart Stores Inc., No. CV122650JFWAJWX, 2015 WL
12712311, at *5 (C.D. Cal. Dec. 16, 2015)
即使被告确实对其进行稍微的修改,但此种程度的修改,并不足以在直接复制的案件中避
免构成侵权……,在直接复制的案件中,即使被告作品的最终结果与原告作品稍有不同,
并不能免除其法律责任。
即便被告对其进行了轻微的修改,。作品稍不同,。
3. Litchfield v. Spielberg, 736 F.2d 1352, 1357 (9th Cir. 1984)
一个作品,只有在从源于之前的原作品中实质取材时,方可视为衍生作品。
4. Authors Guild v. Google, Inc., 804 F.3d 202, 225 (2d Cir. 2015)
原作者享有专属权利的衍生作品,通常是重新呈现原作品中受保护层面的作品,其需具有
表达性之内容(expressive content)。
稳定扩散所输出的图像不太可能与原作相同或近似
本案被告提出一个有力的论点,认为法院应驳回原告之衍生作品理论,因为原告从未能合
理地指控,被告所输出之图像在实质上与原告之任何作品构成相似,或呈现具有著作权之
训练图像中受保护之层面。被告大幅依赖原告自己所一再承认:“对于特定文本提示回应
中所提供的稳定扩散输出图像,不太可能与训练数据中的特定图像匹配而相似”。被告认
为这在技术上是有道理的:因为使用条件资料(conditioning data)来补值(interpolate)
多个潜在图像请参本刊美国画家控告Stability AI生成式AI工具著作侵权之程序判决出炉
,意味着生成的混合图像,看起来不会与复制到这些潜在图像中的任何训练图像完全相同
或近似。基于此,被告辩称原告无法单以输出图像为合理依据,主张违反著作权法之复制
存在。
亦即原告无法举出,被告AI工具能生成任何实际上与其构成相同或近似的“伪造品”,可
见,原告已不依赖具体作品间构成实质相似之理论,只能转而主张所有输出图像都是衍生
侵权作品之论述,并补充指控:输出图像与原告画作的“风格”(in the styles)或艺术
认同(artistic identities)相似关于风格相似是否侵权请参本刊“Midjourney与
Stability AI扩散模型自动生成引爆著作侵权疑云?