※ 引述《amsmsk (山田头顶的鸟大便)》之铭言:
: 人类自己临摹跟机器临摹很多记起来到底差在哪啊?
AI就不是临摹啊 ==
你学过画和玩过AI就知道两边相差多大了 ==
人类在画图的时候,不管是临摹、素描、电绘还是其他劈哩啪啦的,
最主要还是以视觉、记忆、想像去认知各别物体的存在,然后再将它们画出来。
然后持续画下去,人类会越来越熟悉该如何以画去将物体重现。
所以一进画室老师通常不管你未来的志愿是三小,
一定先教你素描静物打稳基础,让你熟练将物体的外貌转为图画的这个过程。
但是目前AI不是这样,
他不是在临摹,而是用训练出来的资料去归纳匹配图片该怎么生出来。
Stable Diffusion用的是去噪,
他会先产一张很丑很杂的图,然后一步一步去噪把图给产出来。
https://i.imgur.com/joetEa9.png
在这个过程里,Stable Diffusion就没有在“画图”。
他对于产出的图上面有什么物件的认知度非常低,
只是知道这样拼,这样去噪产出来的图能接近你给的条件。
所以你会看到AI画出来的东西会出现一堆很神奇的错误。
像是人穿的衣服和背景糊成同一个物件、弹吉他莫名其妙凭空多一条琴颈、
打奶砲的奶子多了一颗奶头,然后老二和奶子融合在一起之类的。
这些都是人类画图几乎不可能出现的错误。
因为人类画图的时候会认知到前景和背景的不同、
正常吉他应该只有一条琴颈而且应该连在琴身上、
一个奶子应该只有一个奶头,老二不会因为打个奶砲就和奶子融合起来。
但是目前的产图AI不知道。
给他做额外的训练可以尽量避免,
但是他终究还是不知道两个奶子夹着一根老二有什么意义,
甚至连他去噪出来的东西是奶子和老二都不太清楚。
所以AI图惹人厌的原因除了一堆猴子乱产图污染环境之外。
主要还是他产图的手段不是真正模仿人类的“画”,
所以看久了自然会有种违和感。
特别是你自己有在产图的话,就会知道现在要生一张AI图有多廉价和无趣乏味 ==