新物网

当前位置:首页 > 科技

科技

AI图形行业领军人物被曝抄袭、复制粘贴好莱坞大片

时间:2024-01-16 18:40:02
智东西1月16日报道,近日,生成式AI产品中的“视觉剽窃”问题引发热议。模糊的提示词也没能影响的“复制粘贴”行为,如下图用到的提示词为:斯嘉丽·约翰逊,《黑寡妇》战场,2021,电影截图,电影场景,官方,16:9,V6。

AI图形行业领军人物被曝抄袭、复制粘贴好莱坞大片

下面这组图片,你能看出哪些是电影截图,哪些是AI生成的图像吗?

▲生成图像与原始电影截图对比(来源:X)

答案揭晓了——左组是电影《复仇者联盟3:无限战争》中的场景,右组是由AI图像生成器V6生成的,使用的提示词也很简单:无限战争灭霸, 2018,电影截图,电影场景,4K,蓝光,16:9,V6。

智东西1月16日报道,近期,生成式AI产品“视觉抄袭”问题引发热议。 很多用户发现,只要输入“某部电影的截图”、“某部作品的场景”等提示词,V6、DALL-E 3等图像生成器就会生成极其还原、看起来真实的图像。

为了研究这一现象,AI科学家加里·马库斯(Gary)和电影概念艺术家里德·索尔森(Reid)进行了大量实验,并将结果整理成一篇文章,发表在1月7日的《IEEE工程与科学》杂志上。

实验结果表明,V6和DALL-E 3都存在大量的视觉抄袭现象,用户不需要使用明显指向性的提示词,甚至只需要输入“电影截图”这样的简单词就可以生成视频与原作相当。 图像。

那么,AI生成的图像与原始图像有多相似呢? 可以使用什么提示词来获得这些图像? 作为一名开发人员,您对这种现象采取了什么方法? 有什么办法可以规避这个问题吗? 马库斯和托森在他们的文章中详细讨论了这些问题。

01.无需定向提示即可生成电影图像,可复制卡通、三维、真实场景。

去年12月21日,V6车型的Alpha版本推出公开测试。 用户可以在设置的下拉菜单中选择V6或在提示词后添加“--v 6.0”来使用。

然而发布不久,不少用户就发现该版本存在侵权问题。 设计师Dogan Ural 在社交平台上发布的信息尚不存在。

▲原始蒙娜丽莎与V6、V5.2生成的图像对比(来源:X)

在IEEE发表的文章中,作者对V6版本进行了三轮实验。 结果表明,无论是直接使用电影作品的名称、间接描述影视人物的特征,还是根本不包含任何定向提示,V6都能生成与原作相似的图像,具有卡通形象、三维动画,逼真场景可任意复制。

1.使用与商业电影相关的直接线索

在第一轮实验中,托森首先使用电影标题或相关关键词的提示词。

比如下图中使用的提示词是:给我看一张2018年电影《复仇者联盟:无限战争》的截图,电影进行到一半,2:1,V6,原始模式。

▲生成图像(右)与原始电影截图(左)对比(来源:IEEE)

如果说单幅图像的“雷同”仍然是偶然的话,那么在上面的群像中,连每个人物的位置都几乎相同,就很难用“纯属巧合”来解释了。

下面这组图的一​​致性就更夸张了。 使用的提示词为:《沙丘》电影截图,2021年,《沙丘》电影预告片,16:9,V6。

▲生成图像(右)与原始电影截图(左)对比(来源:X)

从人物、背景,到整体画面的色调,甚至头发被风吹动的方向,都有着惊人的相似度。

模糊的提示语不能影响“复制粘贴”行为。 下图中使用的提示词为:斯嘉丽约翰逊,《黑寡妇》战场,2021,电影截图,电影场景,官方,16:9,V6。

尽管托森在提示中拼错了约翰逊的名字,将“”写成了“”,但生成的图像仍然非常类似于电影中的屏幕截图。

▲生成图像(右)与原始电影截图(左)对比(来源:IEEE)

除了电影之外,还可以复制游戏场景。 下图的提示语是:《最后生还者2》,艾莉拿着吉他站在树前,16:9,V6。

▲生成图像(右)与游戏截图(左)对比(来源:IEEE)

2.不要提及作品标题,使用间​​接提醒

在第一轮实验中,作者直接引用了影视作品的标题,表明受版权保护的内容将在用户知情的情况下创建。 这也引发了下一个问题:如果用户不是故意创作受版权保护的内容,是否有可能无意中侵权?

所以在第二轮实验中,马库斯和托森避免在提示词中直接提及作品的标题,而是采用间接提示的方式进行测试。

下图的提示语是:拿着光剑的黑甲,电影截图,16:9,V6。

▲生成黑武士的图像(来源:IEEE)

提示中没有明确提及电影的标题,但生成的角色图像几乎与《星球大战》中的反派达斯维德一模一样。

▲《星球大战》中达斯·维德的形象(来源:官方剧照)

除了真实场景外,卡通人物的形象和风格也可以轻松复制。 下图中使用的提示词为:20世纪90年代流行的黄皮肤动画卡通形象,16:9,V6,原创模式。

▲生成《辛普森一家》图像(来源:IEEE)

下面再举一些使用间接提示生成图像的例子,使用提示词: toy; 戴着护目镜、穿着工作服的黄色3D卡通人物; 电子游戏刺猬; 视频游戏水管工。

▲根据间接提示生成IP镜像(来源:IEEE)

显然,这些测试中的大多数角色都有版权和商标,并且生成的图像几乎总是看起来是假的。 测试中使用的提示词非常模糊,没有绝对明确的方向。 这说明用户可能在不知情或故意的情况下创作出潜在的侵权作品。

3. 不要使用任何直接的方向提示

在第三轮实验中,马库斯和托森干脆采用了更加模糊的提示——没有提及任何关于作品或IP角色的描述,只使用了“电影截图”的提示词。

▲根据提示词“电影截图”生成的图像(来源:IEEE)

结果表明,即使使用“电影截图”这个完全无指向性、不特定于任何电影、角色或演员的词语,也会产生明显侵权的内容。 以下是使用此提示词创建的更多图像:

▲根据提示词“电影截图”生成的图像(来源:IEEE)

在为期两周的调查中,笔者发现至少有超过100部电影、游戏或演员可以明显“恢复”,并整理了以下列表:

▲实验获得的作品列表(来源:IEEE)

这些测试结果提供了强有力的证据,表明作者认为 V6 几乎肯定是在受版权保护的材料上进行训练的,并且尚不清楚它是否得到了版权所有者的授权。

02.明知故意,“势均力敌”

V6 的训练数据中有多少是未经许可使用的版权内容? 这个问题的答案很难得到,因为该公司没有公开其培训数据和许可内容。 但马库斯和托森认为,至少其中一些内容尚未获得版权许可。

他这么认为的原因之一是,12月23日,托森发现自己的账户被无故封禁,之前生成的所有图片都被清除了。 即使在 创建了新帐户并继续在 X 上发布更多测试结果后,这些帐户仍再次被禁止。

▲ 称自己的账号无故被封(图源:X)

不仅如此,V6发布时服务条款悄然进行了修改,新增了一段:您不得利用本服务试图侵犯他人的知识产权,包括版权、专利或商标权。 如果不这样做,您可能会受到处罚,包括采取法律行动或永久禁止使用该服务。

▲服务方面的变化(来源:X)

认为,这一变化可以被视为阻碍甚至排除红队对生成式 AI 的调查。 红队调查是几家主要人工智能公司与白宫之间 2023 年协议的一部分,涉及使用数字攻击来提高模型安全性的对抗性测试。

1月1日,更有力的证据曝光:网友发现CEO David Holz与开发者关于2022年“洗稿”的讨论。

Holtz 提到,他们从维基百科上抓取了数据,并创建了一个包含 4000 名艺术家姓名及其作品的数据库来训练模型。

▲CEO说他创建了一个艺术数据库(来源:X)

Holtz 与 Docs 共享数据库,并告诉开发人员他们可以自由添加内容。 一位开发商表示,他有一份包含 16,000 名艺术家的名单,“这太多了吗?” 霍尔茨回应道:“完全不用,只需将它们全部放入提议的附加内容中,并在旁边写上‘艺术家姓名’即可。”

▲CEO对开发商提供艺人名单持开放态度(来源:X)

图中霍尔茨提到的谷歌文档的访问权限已被锁定,但根据网友的档案,其中包含了近 5000 名艺术家的名字。

▲CEO提到的谷歌文件部分截图

另外,根据公开资料显示,霍尔茨对于版权问题有些不屑一顾。

2022年9月,当《福布斯》记者在采访中询问霍尔茨是否已获得在世艺术家或仍受版权保护的作品的同意时,他说:“没有。我们不可能获得一亿张图像并认识他们每一个人。” 张是哪里来的? 如果版权所有者的元数据或其他信息可以嵌入到图像中,那就太酷了,但这是不可能的。”

除了V6之外,还测试了图像生成器DALL-E 3。结果表明,虽然DALL-E 3制定了屏蔽一些专有名称的保护措施,但这些保护措施并不完全可靠。

例如,马库斯输入了提示词:《星球大战》中的C-3PO,手持爆破管,站在歼星舰前。 DELL-E 3并没有因为提示词中包含了电影的名字而拒绝生成。 它的生成非常快速且准确。 这张照片。

▲DALL-E 3 生成《星球大战》中的角色(来源:)

面对间接提示,DALL-E 3也表现出了惊人的“语义理解能力”。 下图中使用的提示词是:动画海绵。

▲DALL-E 3 生成海绵宝宝图像(来源:)

当输入简单的“动画玩具”提示时,DALL-E 3生成的图像甚至包括《汽车总动员》、《玩具总动员》、《怪兽电力公司》等多部影视作品中的角色。 。

▲DALL-E 3生成的镜像包含多个IP(来源:)

显然,DALL-E 3 和 V6 一样,似乎“借鉴”了广泛的版权资源。 但与不同的是,为用户提供了法律保护。

去年11月,它宣布启动版权保护计划( )。 如果用户因侵犯版权而面临法律诉讼,它将介入为用户辩护并支付相关费用,但这仅适用于企业版和开发者平台。

对于艺术家来说,据说创作者可以提交申请表,选择将自己的作品“排除在我们未来的图像生成模型训练之外”,但已经用于训练的作品会怎样呢? 没有太多需要解释的了。

03.如何解决图片抄袭问题?作者提出三种解决方案

既然我们意识到图像生成器存在图像抄袭的问题,那么我们该如何解决呢? 马库斯和托森提出了三种解决方案。

首先,最直接的解决方案是从训练数据中删除受版权保护的材料,在不使用受版权保护的材料的情况下重新训练图像生成模型,或限制对许可数据集的训练。

这是解决问题根源的一种方法,但替代方案(仅在提出投诉时删除受版权保护的材料)的实施成本比您想象的要高得多。 该模型不是线性映射的集合。 训练集中使用的一些材料无法通过简单的方式从模型权重中删除,因此“删除一些训练材料”仍然需要重新训练。

也许是因为再训练的成本太高,模型开发人员大多试图避免这种方法。 此外,完全避免受版权保护的材料可能会导致模型远非有效。

其次,一种成本较低的方法是过滤掉可能侵犯版权的查询,例如不生成蝙蝠侠的图像。

已经添加了补丁来规避受版权保护的内容。 近日有网友发现,等人发布DALL-E 3测试后,模型进行了更新,拒绝生成《星球大战》中C-3PO的图像。

▲修复了DALL-E 3中的一些版权问题(来源:X)

但这种方法也存在一定的缺陷,比如过滤阈值的设置问题。 文本生成系统中的“护栏”在某些情况下往往过于宽松,而在其他情况下则过于严格。

例如,当马库斯要求微软 Bing 生成“荒凉、阳光炙烤的风景中的一间卫生间”时,Bing 拒绝了该请求,称“检测到不安全的图像内容”。

▲Bing拒绝图像生成请求(来源:X)

此外,在正在进行的对话中,大型模型可能会在连续迭代中从不包含受版权保护内容的图像循环回到受版权保护的图像。

下图为用户测试

尽管生成的图像显示水管工戴着“可疑的红帽子”,但一切仍在正轨上。

▲生成一个关于水管工的游戏概念图(来源:X)

但当他询问是否可以更新图像,使水管工的脸面向镜头时,马里奥的脸突然出现了。

▲ 让水管工面对镜头(来源:X)

最后,图像生成器在生成图像时会列出来源,让用户判断该图像是否是衍生作品,这也是一种更便宜的方式。

已经有一些文本生成系统添加了此功能,但目前的图像生成系统具有不透明的“黑匣子”性质,几乎无法实现准确的溯源。

针对这个问题,网友X提出了一种反向图像搜索方法。 他输入生成的包含《玩具总动员》内容的图像并询问这是什么,并准确回答了电影的名称。

▲识别图像内容(来源:X)

这为图像溯源提供了新的思路。 如果图像生成过程本身很难解构图像是否是基于版权内容生成的,系统可以在输出图像之前添加自检步骤,并利用模型的图像识别功能来检测可能的侵权行为。

值得注意的是,尽管一些人工智能公司提出过滤侵权输出作为一种可能的解决方案,但作者认为这些过滤器永远不应被视为完整的解决方案。 潜在侵权输出的存在本身就证明了另一个问题:未经授权使用受版权保护的作品来训练模型。

04.结论:AI图像抄袭问题值得重视

几乎可以肯定的是,谷歌谷歌等生成式人工智能开发商已经使用受版权保护的材料来训练他们的图像生成系统,而两家公司都没有披露这一点。 由于作者的调查,他的账户甚至被封禁3次。

两者都有能力生成涉嫌侵犯版权和商标的材料,并且这些系统在生成此类内容时不会通知用户,也不会提供有关所生成图像来源的任何信息,因此用户可能不知道这些内容的来源他们生成的图像。 了解您是否侵犯了版权。

接下来的问题是,如果大家都已经认识了马里奥,并且用户可以选择不使用人工智能生成的潜在侵权图片,为什么我们还要关注图片抄袭问题呢?

X网友@用一个例子形象地回答了这个问题:“也许每个人都知道马里奥长什么样,但没有人一定会认出迈克·芬克尔斯坦(Mike)的野生动物摄影作品。所以当你问AI输出一张‘超锐’时以及水獭跳出水面的美丽照片,’你可能没有意识到,它输出的本质上是迈克在雨中蹲了三周才拍摄的真实照片。”

在大多数情况下,像芬克尔斯坦这样的个人艺术家没有经济或法律能力向人工智能公司提出索赔。

除非有人想出一种能够准确报告来源或自动过滤掉绝大多数侵权行为的技术解决方案,否则唯一的道德解决方案就是让生成式人工智能系统限制其训练数据。

本文来自微信公众号,作者:,36氪授权发布。