[新闻] AI与画家智财诉讼案例系列3:美国画家告M

楼主: stpiknow (H)   2024-03-08 07:49:57
战程序判决吞败
原文网址:
https://bit.ly/4c7EVwI
原文:
自ChatGPT崛起造就AIGC (AI Generated Content)的百花齐放,导致许多新创公司站在AI
浪尖上声名大噪,像Midjourney和Stability AI推出的稳定扩散(Stable Diffusion)图像
生成(还有OpenAI的DALL-E),可让使用者以文生图、以图生图,自动产生媲美专业画家
的图像,让Midjourney夯到不行,是目前业界顶尖的龙头代表。
但也正因太火而产生智财争议诉讼,美国三位艺术家对Stability AI、DeviantArt和
Midjourney所开发之生成式AI工具,于2023年1月向北加州联邦地院提告著作侵权 [1],
而各被告都提出驳回原告起诉之动议(motion to dismiss,被告于案发初始阶段,主动
要求法院直接驳回起诉,目的在省却旷日费时之冗长程序,如成功即可提早终结官司),
业经法院于2023年10月底,做成中间判决性质之程序裁定。本刊前已介绍Stability AI和
DeviantArt部分,本文续对Midjourney进行分析。
本案涉及之Midjourney产品
Midjourney公司总部位于旧金山,其于2022年7月推出的Midjourney产品,初期以测试版
形式问世随后转型为商业产品。Midjourney的AI工具能根据文本提示(prompt)生成专业水
准的图像。起初是在Discord社群建立机器人,随后快速转向商业应用,短短半年内吸引
超过千万付费注册帐户,成为引人瞩目年营收达1亿美元的企业(但这家传奇性的公司正
式员工仅11人)。
原告声称,Midjourney产品是一款线上AI图像生成器,透过不同迭代版本使用稳定扩散技
术,根据文本提示生成图像。目前版本是在图像子集上使用稳定扩散进行训练,该图像产
生器以文本提示输入,生成数位图像输出,系完全依赖稳定扩散作为其生成图像的基础软
体引擎,再向网络聊天系统Discord的线上使用者及透过应用程式之提供来收费。
Midjourney的执行长曾表示,该公司使用大型开放数据集,已“暗示”使用LAION数据集
进行训练,2022年8月Midjourney发布使用稳定扩散之测试版。
本案涉及之扩散技术原理
原告起诉状指出,“扩散”(diffusion)是一种特定机器学习应用的模型技术,以软件生
成与训练数据中图像相似之输出图像,该模型存储训练数据集中每个项目的压缩副本。此
扩散技术系由史丹佛大学Jascha Sohl-Dickstein领导的一组研究人员于2015年发明,并
在其论文中介绍“使用非平衡热力学(Nonequilibrium Thermodynamics)的深度非监督式
学习 (Deep Unsupervised Learning)”,该技术可应用于任何类型的数据,但该论文是
集中在数位图像之应用。
扩散分二个阶段进行,第一阶段是摄取图像,并透过系列步骤逐渐向其添加更多噪声(
noise即噪声,指看到的而非听到的东西,系混乱和无结构的随机波动(random
fluctuations)),在每个步骤中,程式会添加噪声(addition of noise,即“加噪”)
来改变图像;到最后一步骤,图像已经“扩散”成本质上随机式的噪声(random noise)。
第二阶段与第一阶段相似但次序相反,透过众多步骤将特定图像变成噪声的过程后再回溯
运行,亦即,将随机噪声以相反顺序应用这些步骤,随着逐渐去除噪声数据(denoises,
即“去噪”),程式最终还原重新组合成该原来之图像。起诉状中摘自Sohl-Dickstein论
文,使用螺旋图像作为训练数据说明扩散过程的二个阶段如下图。

第一行(蓝色螺旋)从左到右读取,描绘扩散第一阶段,噪音逐渐添加到螺旋图像中(其
未显示当中的每个步骤)。中间的图像显示扩散过程中途的螺旋,最右边的图像显示扩散
过程结束- - 螺旋变成一随机噪声场域。
第二行(红色螺旋)从右到左读取显示相反过程:随机噪声(最右边的图像)逐渐取消扩
散,透过反转第一阶段学习步骤的次序来“去噪”。中间的图像显示中途点(halfway
point)的去噪过程,第二行最左边的图像,显示去噪过程的最终结果:原始螺旋再次回复
出现。
原告指控被告之AI生成工具,即以上述运作方式复制其著作权图像来自动生成侵权图像。
原告对Midjourney直接侵权之指控
原告指控:Midjourney的订阅者可透过造访其Web应用程式,然而问题在于,它是依赖盗
用艺术家创作之数百万张图像,并将这些图像用作训练图像,因此是从他人受著作权保护
的作品中,重新混合组装和拼贴产生侵权图像。当被问及Midjourney如何使用数据集时,
Midjourney的执行长仅回答:“这是网络上的一个大规模扫描,我们使用已发布的开放数
据集进行训练。”
原告针对Midjourney的直接侵权理论为:
(1) 透过抓取(即复制)受保护的作品,用于为Midjourney产品训练图像所制作出图像,
而构成直接侵权;
(2) 透过发行包含训练图像压缩副本的稳定扩散,作为Midjourney产品的一部分而构成直
接侵权;
(3) 透过制作和发行Midjourney产品而构成直接侵权,该Midjourney产品本身就是侵权之
衍生作品;
(4) 生成并发行属于侵权衍生作品的输出图像。
针对原告指控Midjourney工具训练数据集用来输出图像,包含接受训练之受著作权保护作
品的压缩副本,但Midjourney反驳这是不合理而难以置信的,因为50亿张图像庞大,不可
能被压缩到一个可执行的程式。针对第一个理论,与关于同案被告Stability AI在LAION
中的角色,以及Stability AI抓取然后在稳定扩散中,使用训练图像做联系的详细指控不
同请参本刊:美国画家控告Stability AI生成式AI工具著作侵权之程序判决出炉,原告对
于Midjourney为其品进行哪些训练,竟然并无任何事实之陈述。唯一提及的是Midjourney
首席执行官的评论,即Midjourney是使用开放数据集(原告假设这些数据集来自LAION)
,并且在这些数据集上进行训练。然而,原告宣称Midjourney所使用稳定扩散之方式,如
:“稳定扩散已在多个程式中被用作软件库(software library),包括Midjourney产品”
;“作品是指用于训练任何稳定扩散版本的任何图像,该图像由被告直接提供或合并到另
一个产品中”云云。
北加州地院对直接侵权之程序裁定
但法院认为以上说法,就原告究竟是基于Midjourney使用稳定扩散,还是基于Midjourney
自己独立使用训练图像来训练产品,还是二者兼而有之?其主张都太含混不明需要澄清。
因此,法院认为原告对Midjourney的直接侵权指控不够清楚,原告也未提供事实说明
Midjourney对其AI平台进行哪些训练,因此在缺乏事实的情况下,法院无法确定
Midjourney是否不当使用原告受著作权保护的图像。另外,原告对Midjourney的衍生作品
责任理论也有缺陷,原因与法院在讨论DeviantArt案时所指出的原因相同请参本刊:美国
画家控告DeviantArt生成式AI著作侵权首轮程序判决被告占上风。据此,法院核准
Midjourney所声请驳回直接侵权的动议,但允许原告可予以修改(with leave to amend)

法院进而表示,原告除应添加被告产品使用受著作权保护之压缩副本的事实外,
Midjourney将来可能会对直接侵权主张进行更针对性的攻击。例如,不清楚的是,稳定扩
散是否仅包括可应用于建立图像的算法和指令,而这些图像只含有受著作权保护之训练
图像的一小部分元素(a few elements);当Midjourney仅透过其应用程式和网站,将稳定
扩散作为“文库”(library)提供客户使用时,其为何需要负直接侵权之责?凡此种种法
院都认为不确定。然而,法院并未完全排除原告可辩护这一指控的可能性,特别指出原告
如能合理地主张,被告的AI产品可让使用者,透过引用原告姓名的作品来创作新作品,以
及原告受保护的内容究竟系如何、以及有多少留在稳定扩散中被AI最终产品所使用的,则
其立论可能会更坚强。
原告对Midjourney代理侵权之指控
原告指控,使用者透过被告AI图像工具,输入原告姓名后就会产生冒充艺术家原作的图像
,这些使用者可谓是“冒名顶替者”,而其依赖艺术家的原作品,输入含有特定艺术家姓
名的提示回应,所产生的冒充图像就是“伪造品”。因此,被告应知悉其AI工具的功能容
易用来生成伪造品。冒名顶替者出售伪造品使原告因受损,因而被告从AI工具中,直接或
间接地从冒名顶替者的侵权行为中获利,故其应对第三者的侵权行为,承担代理侵权
(vicarious infringement)责任。
但法院认为,法律上要对代理侵权行为负著作侵权责任,原告必须指控被告(1)拥有监
督侵权行为的权利和能力(right and ability to supervise),以及(2)在侵权活动中
获具有直接的经济利益。参Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d
788, 802 (9th Cir. 2007)。但问题在于,本案原告针对三位被告之起诉,无分轩轾地将
其看成一体、笼统指控其全都构成代理侵权,但具体上哪个被告基于第三人的何种行为,
得以构成代理侵权却并未明确指出,且其起诉状中对不同被告间无区别的指控,常将三位
被告混为一谈,难以厘清每个被告究竟谁实际从事何项确切行为,导致法律上可造成间接
侵害,完全混淆不明。
Midjourney因而抗辩,原告指控其代理责任之主张应被驳回,因为依Sound & Color,
LLC v. Smith案例,No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal.
Feb. 28, 2023),被告不能对自己的直接侵权,承担间接侵权中之次级责任(secondary
liability)。因而,当使用被告的生成式AI产品构成侵权时,只有在对每个被告提出的直
接侵权主张充分表达后,法院才能确定,原告是试图让被告对自己的直接侵权承担次级侵
权之代理责任,还是让被告对他人使用其产品的直接侵权来负间接侵权之责,凡此,原告
之主张都含糊不清应被驳回。
北加州地院对代理侵权之程序裁定
法院认为,原告基于“冒名顶替者”使用被告工具产生“伪造品”的代理侵权主张,还存
有其他重要问题。因原告的诉状中未能指控,被告以原告作品制作出基于该作品实际存在
的“伪造品”为何。反之,原告自己起诉状中还承认:“根据扩散过程的运作原理,一般
而言,对于特定文本指令提示所回应产生由稳定扩散输出的图像,不太可能与训练数据中
的任何特定图像相匹配而近似(close match)”。亦即原告无法举出被告AI工具,能生成
任何“实际上”与其构成相同或近似的“伪造品。可见得,原告已不依赖具体作品之实质
相似理论,只能转而攻击所有输出图像都是衍生侵权作品,然后再补充指控:被告输出图
像与原告画作的“风格”(in the styles)或艺术认同(artistic identities)相似关于风
格相似是否侵权请参本刊“Midjourney与Stability AI扩散模型自动生成引爆著作侵权疑
云?

Links booklink

Contact Us: admin [ a t ] ucptt.com