Re: [问题] AI 风格怎么了吗?为什么容易腻?

楼主: Satoman (沙陀曼)   2024-11-04 23:07:05
※ 引述《lcomicer (冷水青蛙锅)》之铭言:
: 可能大多套用相同模型去跑是其一
推 SaberMyWifi: 新手调的AI几乎都默认出来的不耐看,高手调的就很棒11/03 10:21
推 uohZemllac: 因为有在认真专研做出变化的的ai绘师少之又少11/03 10:25
→ uohZemllac: 一堆一看就是直接用sd洗版的能不腻ㄇ11/03 10:25
其实和大家想的刚好相反,
那些“看起来很腻”的AI图其实才是许多不同的模型分别生出来的。
而所谓“风格比较多变”、“不是默认画风”的AI图,
生那些图的人搞不好换模型的频率还没“看起来很腻”的多。
首先要说明一件事,除非你用的是线上生成网站如midjourney,
否则大家用的大多都是SD stable diffusion,或是其模型或技术本身的衍生产物。
另外,AI没有默认的画风或模型。
真的要讲默认,如果你用的工具是最入门的automatic1111 webui懒人安装包的话,
他的确是会默认帮你下载一个模型叫SD15NewVAEpruned。
但假设我想用这个模型生一个穿着洋装的少女走在海边的日式ACG风格图片,
那这个模型生出来的东西可能长这样:
https://iili.io/2xCWcNe.png
或这样:
https://iili.io/2xCW6JI.png
上下取决于你要用咒文式提词或自然语言提词,但结果都是不可名状之物。
这其实就是早期被认为能实用的图片生成模型stable diffusion1.5。
基本上,阳春版的stable diffusion1.5并没有针对日式ACG风格训练,
因此生成不可名状之物是注定的结果。
第一个尝试让AI学习ACG画风,模型基于SD训练的是Waifu Diffusion,
早期的WD生出来的图片大概是长这样:
https://iili.io/2xCvzxI.png
另一方面,原本主打线上AI小说生成的网站novelai则是以SD为基底训练,
推出了在宅图生成方面相当卓越的线上生图服务。
novelai生成的图片大概长这样(有没有开始腻了):
https://iili.io/2xCStln.png
novelai不知道是公司内部本身的爱好,还是基于市场策略,
在当时主流都在研究真人图片或照片的时候,他们主打宅图这招算是确立了市场独特性。
至于他们成功的秘诀其实也很粗暴简单,
就是直接把网络上最大的宅图盗图网站当训练集给AI学习。
而无心插柳柳橙汁,他们在训练时把网站的分类tag也一起让AI学了,
这让novelai的模型对于标签式的提词有相当的理解能力,
取代自然语言的“咒文”也开始流行。
(附带一提,最新的Flux模型主打自然语言,但是那个自然语言有时候写起来更像咒文 ==)
如果你提词打得够全,那它甚至能生出某些在训练集中占比较高的热门角色,像这样:
https://iili.io/2xCs3Is.png
这件事的争议其实很大,毕竟它训练集来源是盗图网站,而它也没经过对方允许,
等于是盗上加盗。
然后呢,相当戏剧性的,novelai的模型某一天就突然被人干出来了。
这个外泄的模型一般通称为NAI,很快就被各路人马抓来进行各种调整训练。
事实上,前年至去年的ACG风格的AI图可能有九成以上都是基于NAI的衍伸产物。
再加上微调模型Lora解决了AI无法生成冷门和新角色的短版,
AI群魔乱舞的时代时代也随之开启。
这时代的模型生成的图片大致上长这样,像是热门模型hassaku:
https://iili.io/2xCyl3b.png
(这张图应该最腻,没错吧?)
同样也很热门,眩光效果突出的Cetus-Mix则是长这样:
https://iili.io/2xnd6b4.png
(应该也很腻吧,这模型是当时很多推特AI仔的首选)
又或是我认为最杰出,擅长把背景搞得异常丰富(杂乱)的agelesnate:
https://iili.io/2xn95RR.png
(这张应该没那么腻,因为这模型比较没有名气)
各位仔细瞧的话应该会发现,这三张图片乍看之下画风不同,
但是其实都可以看出来是原始NAI的衍伸产物。
SD1.5由于设备需求较低,当时的AI仔社群比现在活跃许多,
很多人用自家显卡,以NAI为底搞出各种不同的混合模型。
但由于原始模型SD1.5的上限,当时的AI图除非加上风格强烈的画风lora,
否则都很难完全脱出NAI的既成风格。
所以那个时代的图片大家看得最腻,但实际上模型种类却是最多的。
至今SD1.5还是有不少使用者,因为它需求的设备较低,能用4GB的显存勉强跑。
另外也有不少人是觉得SD1.5选择多、变化多,
或是单纯喜欢这种风格因此留在1.5时代。
下个时代则是stable diffusion XL的时代,简称SDXL。
stable diffusion的母公司在stable diffusion 2遭遇了滑铁卢等级的惨败,
SD2相比SD1.5并没有显著的成果提升,而且还删除了色情图片的生成能力。
没有色情的开源模型价值可想而知的是低到不行,结果当然是直接被大多数AI仔蛋雕。
虽然他们有搞个SD2.1补救,但为时已晚。
之后推出的SDXL则是一开始没在AI宅图圈引起太多波澜,
但是数个月后随后基于SDXL调整训练的模型则是彻底改变了AI仔的生态。
第一个是Pony,这也算是一个无心插柳柳橙汁的模型。
如同名称,Pony主要的学习目标是彩虹小马,
但是最终的成果是则是一个泛用性高,在各方面都有及格水准的模型。
原始的Pony生成的结果较接近欧美审美,最热门的衍伸模型AutismMix生成结果则是这样:
https://iili.io/2xord8X.png
这结果一路看下来应该很多人会觉得人物立像没有进度,可能还退步了。
是的,Pony系的模型的缺点不少。
最明显的就是整体生成结果偏暗,用色偏脏。
另外由于训练流程中出错,pony在生图时必须打上审美分级标签作为提词和负面提词,
这点也让部分使用者颇为诟病。
最麻烦的一点则是Pony的Lora必须为它专属,不仅是以前SD1.5不通用,
连其他以SDXL为基底的LORA也无法完全适用于Pony模型。
但是以下这张图可以清楚地告知为何缺点虽多,它仍成为目前最流行的开源宅图模型。
https://iili.io/2xobwFa.png
对,Pony系模型对于提词的理解远高于过往的SD1.5、NAI模型。
特别是在“多人互动”方面,坦白讲就是:“色图”。
基于SDXL的Pony本身对于提词的理解力远高于SD1.5数倍,
像上面那张图片在SD1.5时代抽了乱数几百张,挂了好几个外挂尿袋,
用inpaint涂涂抹抹了大半天可能都不一定生不出来。
但是在Pony时代,这类图片却只要不到一分钟的时间输入提词,
并且调整一下分区外挂就能快速生成,节省的时间可能有数百倍之多。
这张绫波零明日香我甚至没有抽乱数,是直接拿第一张生成的图片。
Pony出现的时机也和最大的AI模型网站civitai开始线上生成服务相应,
civitai对于Pony的推广在当时也算是不遗余力,促成了现今Pony一统天下的局面。
另外一个热门模型则是Animagine XL,其生成的图片如下:
https://iili.io/2xzlDwg.png
平心而论,个人觉得Animagine XL生的图其实比pony好看,
它的Lora能与其他SDXL模型互通也是其优势。
Animagine XL和pony孰优孰劣其实一直是AI仔的热门论战。
不少帮Animagine抱屈的人会觉得它只是败在Pony的色图攻势,
反方也有人认为Pony并不是真的只靠色图,而是单纯在理解提词方面胜出。
总之,这个模型也是有其爱好者。
虽然在色图方面较为不足,但是在非多人运动图片,特别是单人角色图方面有其优势所在。
那就回到开头了,那些“风格比较多变”的AI仔用的模型最有可能是什么呢?
是Pony还是Animagine XL?
答案是:复仇归来的novelai的SDXL新模型novelai3,俗称NAI3。
平心而论,在色图方面NAI3仍是略逊Pony一筹,但是它有自己的三个独特优势:
1.认识的角色多且完成度高,特别是当时的热门手游角色如:档案、马娘或原神。
2.认识的画师画风多且再现率极高。
3.擅长把以上两者混合。
以档案角色举例来讲,大概就这样:
https://iili.io/2xTBG0G.png
然后1+2玩久了之后,就有人开始尝试2+2,也就是将不同的画师风格混合,
甚至是1+2+2。
一样以档案角色举例来讲,大概就这样:
https://iili.io/2xTNGt4.png
或这样:
https://iili.io/2xTSnSI.png
又或者这样:
https://iili.io/2xTPTD7.png
是的,大部分的AI仔达成“风格比较多变”这个前提其实不是他们自己有练模型,
也不是他们经常换模型。
而是他们使用的模型本身就能以提词去拼、去叠、去组合、去接龙,
以不同画师的画风组合达成风格多变,甚至是“没有AI味的效果”。
要达成这种效果,其实也就是在提词写上角色名字+画师名字+画师名字一直往下叠。
单以图片生成来讲,这有很难吗?
一开始接触如果你平常没在追画师可能确实有点难度,
但是熟了,或者从别人那边要到提词,单纯叠画师也是几分钟内的事情。
以现在来讲,由于SD1.5和Pony都是以清洁的线条与均匀上色的风格为主。
所以AI仔在叠画师通常会选择那些线条笔触强烈(或者相反没什么线条),
上色色块明显,但是脸部特色又没有太独特的画风为主。
甚至有些人为了加强笔触,会把以前通常放在负面提词的sketch(素描)拉到正面提词。
最衰,最常被拿来叠的大概就以下几位:
TrNyteal(我感觉几乎每张都有他 ==)、
藤ちょこ、にんげんまめ、rei_17、DSマイル、ヒトこもる等等。
然后叠完可能还会再追加几个画风比较强烈的来修补。
例如觉得图片太平没立体和光影就叠个as109、
不够美少女画风就叠个YD试试、想要偏写实一点就叠个wlop、
想要特别一点的风格就加上ratatatat74等等。
对了,有些画师的名字建议别在公开场合估狗,社会性死亡机率很高 ==
所以真的是风格多变就是所谓的“用心的咒术师”吗,也不一定,
在电脑前的他其实搞不好其实只是一直在玩画风叠叠乐,然后拉长图片放出时间而已。
甚至我都在怀疑某些说自己有加笔的根本没加,
不然就是只修最容易看出破绽的眼睛和手。
至于之后吗?
novelai我记得很久以前就说在弄NAI4了,只不过目前还没消息。
开源部分,
其实Kohaku(这位是台湾高材生)在今年初弄出来的模型Kohaku-XL系列,
在角色认知和叠画风方面已经可以有和NAI3互角的本钱。
只可惜他本人似乎没有足够的设备($$)提供算力让模型精益求精。
我手上的Kohaku-XL Epsilon用叠叠乐生图的结果大概长这样:
https://iili.io/2xAUJJp.png
前月推出的开源模型Illustrious XL则是以Kohaku-XL为基础,
而它本身和衍伸的各模型实质上已经在各方面超越了Pony和NAI3。
写到这边我懒得再切模型读取了,直接贴今天和前几天测试的叠叠乐 ==
https://iili.io/2xAtcJe.png
https://iili.io/2xREcml.png
https://iili.io/2xAtAs2.png
https://iili.io/2xAtzbf.png
https://iili.io/2xAt5fS.png
https://iili.io/2xAtuWl.png
(角色方面除了小孤独其它有套角色Lora)
这些叠叠类有些是我自己乱凑,有些是照抄别人的,
总之大部分脱离不开上面的提及的可怜画师。
虽然不是同一个模型生的图,但是原理基本上大同小异,
也都是Illustrious XL的衍伸产物。
我以前说过Illustrious XL在色图方面没Pony强,
但过了一个月一些优秀的微调模型问世之后在色图上Illustrious XL也确实超越了Pony。
至于为什么现在Illustrious XL还没有非常热门?还是一堆人留在Pony?
真正的原因大概是civitai正在全力推广那个又肥又贵,
写自然语言能写到比标签提词更像咒文的flux吧 ==
回标题,那些AI图看不腻?
对AI仔我来讲,
只要是愿意公布自己的生成提词和参数的图片,不管它是什么风格什么模型,
我看再多都不会腻。
而那些想赚热度,对生成细节和技术一个字不提,
只写个“AI生成”、“AI加笔”的推特AI仔的图倒是真的腻。
(因为用了萝莉相关提词怕被搞的不公布不算,这点我可以理解 ==)
甚至还有那种明明就自己加了一堆尿袋外挂,提词写得天花乱坠去千方百计去引导AI,
尿袋里的尿都快满出来了,却硬要说成“AI想的”那种更是腻上加腻 ==
至于那种明明是AI图却不标注的也没啥好讲,就是想骗热度而已 ==
啊对了,别问我为什么不公布参数和提词。
我没写出来是因为这个图床有保留PNG INFO,想要的可以直接自取 ==
作者: SaberMyWifi (赛巴我老婆)   2023-11-03 10:21:00
新手调的AI几乎都默认出来的不耐看,高手调的就很棒
作者: uohZemllac (甘草精华雄没醉)   2023-11-03 10:25:00
因为有在认真专研做出变化的的ai绘师少之又少一堆一看就是直接用sd洗版的能不腻ㄇ
作者: memoriespass (Naiwek)   2024-11-04 23:17:00
感谢指引,之前只玩过pony和an imagine,发展到flux后反而不会玩了
作者: x2159679 ((● ω ●))   2024-11-04 23:22:00
我原本在那串还在想版主怎么还没出现(′・ω・‵)
作者: andyleeyuan (元哥)   2024-11-04 23:24:00
可以玩玩看Kohaku-XL Zeta
作者: uohZemllac (甘草精华雄没醉)   2024-11-04 23:25:00
推解释
作者: andy0481 (想吃比叡的咖哩)   2024-11-04 23:28:00
我觉得单纯就是 没变强太多 那就懒得学新的 就继续用==
作者: tchaikov1812 (柴犬夫斯基)   2024-11-04 23:32:00
nai3真是好用的可怕,我是从Animagine XL跳槽到nai3的,简简单单就能生出好看又自然的图,唯一可惜的点是新一点角色不能生成
作者: twosheep0603 (两羊)   2024-11-04 23:32:00
Pony Animagine Illustrious算是现在AI色图三国鼎立不过最近有个NoobAI XL在预热 不知道你有没有兴趣
作者: aria0520 (紫)   2024-11-04 23:37:00
其实某种程度上的幸存者偏差 看不出来是AI图的就不会被统计在AI图的审美内
楼主: Satoman (沙陀曼)   2024-11-04 23:38:00
NoobAI其实就Illustrious的再衍伸
作者: twosheep0603 (两羊)   2024-11-04 23:39:00
那看来就是精修版了(
楼主: Satoman (沙陀曼)   2024-11-04 23:39:00
我测试过,Illustrious的Lora可以用在NoobAI,但是反过来效果却会下降
作者: clothg34569 (提拉米苏冰淇淋)   2024-11-04 23:39:00
Noob是IL延伸的 目前Noob都是用IL底模的Lora
作者: aria0520 (紫)   2024-11-04 23:40:00
当底特律变人的主角拔下蓝圈后 就没人知道他是机器人了
楼主: Satoman (沙陀曼)   2024-11-04 23:40:00
而且NOOB目前三个版本结果差很大,几乎可以算不同的模型了 ==
作者: x2159679 ((● ω ●))   2024-11-04 23:45:00
话说老八那张用google找图都是跑一堆跟老八没关系的AI图耶 真神奇......
作者: zxcmoney (修司)   2024-11-04 23:51:00
推解释
作者: karta018 (石头先生)   2024-11-04 23:58:00
好详细推
作者: x2159679 ((● ω ●))   2024-11-05 00:09:00
话说最下面那张luce是只靠原设定图就能生出来的吗
作者: inte629l   2024-11-05 00:10:00
难怪我在Animagine上练的LoRA套到Pony就超怪..
作者: mantouman   2024-11-05 00:12:00
好详细
作者: silentneko (默默猫)   2024-11-05 00:16:00
大咒术师是你
作者: organic3321 (有机酸)   2024-11-05 00:25:00
到Illustrious XL终于有种可以跟人一较高下的感觉用你的图当参考的话
作者: ZunYin (感谢我生命中一切的美好)   2024-11-05 00:46:00
特级咒术师
作者: inte629l   2024-11-05 00:55:00
补推
作者: zChika (滋琪卡)   2024-11-05 00:55:00
Luce
作者: windconcerto   2024-11-05 00:58:00
感谢解说
作者: conqueror507 (冷箭)   2024-11-05 01:15:00
最近在玩pony,觉得比较特别的部份是,pony 模型不需要很高的权重,就可以画出人物,但是权重的高低却对画风会有很大的影响
作者: avans (阿纬)   2024-11-05 01:20:00
推衍生介绍
作者: ruby080808 (zzz5583)   2024-11-05 01:24:00
后面两组的感觉真的比较好看= =
作者: speed7022 (Speed7022)   2024-11-05 01:27:00
作者: lcomicer (冷水青蛙锅)   2024-11-05 01:30:00
对我这种不了解AI详细运作方式的人 所谓模型其实是略称指称的是用类似设定去达成目的之意 中间叠再多层都一样就是说这种层层叠出来的成果即是“怠惰AI仔”想要的
作者: x2159679 ((● ω ●))   2024-11-05 01:36:00
因为用ai的人跟研究ai的人不一定是同一批人绝大部分的人绝对是负责收割成果的人,不管是绘师还是研究者的
作者: lcomicer (冷水青蛙锅)   2024-11-05 01:37:00
他们大多没意图也无法对细节进行修正会觉得腻并不是因为他们用的工法简单繁复 而是美感追求做的事情就是把台面最强风格组成要你命3000
作者: x2159679 ((● ω ●))   2024-11-05 01:41:00
其实本来艺术界就有个词汇拿来指类似现象
作者: lcomicer (冷水青蛙锅)   2024-11-05 01:41:00
画面没有取舍还塞满了他人的坚持 所以看了很腻
作者: x2159679 ((● ω ●))   2024-11-05 01:42:00
就是“匠气”啊我觉得这波ai图就是把匠气这个词汇发挥到淋漓尽致的结果
作者: tym7482 (Max)   2024-11-05 01:44:00
长知识推一个
作者: assotr (巴嘎囧)   2024-11-05 01:44:00
我比较好奇以后大模型还有得更新吗 现在网络上充斥着ai图拿去训练会不会变成一代不如一代
作者: speed7022 (Speed7022)   2024-11-05 01:46:00
楼上说的就是AI训练资源的问题,好的资源会越来越珍贵不只AI图,文字也是
作者: x2159679 ((● ω ●))   2024-11-05 01:57:00
盗图网站不会盗AI图吗? 他们是怎么区隔AI图跟绘师图的(′・ω・‵)
楼主: Satoman (沙陀曼)   2024-11-05 01:59:00
网站的图片是人上传的,不是爬虫
作者: Alter (总是冷场)   2024-11-05 02:22:00
虽然有些名词看无但很有趣的介绍
作者: cains70 (屁屁卡屁屁啦啦)   2024-11-05 02:40:00
作者: nightcrow (叶子曰)   2024-11-05 02:52:00
随便点进来没想到内容超有料
作者: Snomuku   2024-11-05 02:58:00
哪个盗图网站这么精准?
楼主: Satoman (沙陀曼)   2024-11-05 02:59:00
板规禁止讲的网站 ==
作者: ohyeaaaah (大麻叶)   2024-11-05 04:34:00
推,专业文
作者: Sinreigensou (神灵幻想)   2024-11-05 05:17:00
其实我比较好奇ai怎么从以前面瘫跟死板的动作变成现在表情丰富又可以玩花式体位,以前觉得没fu现在可以尻了p站一堆实用ai咒术师
作者: showwhat2 (华仔)   2024-11-05 06:16:00
推、推!很丰富详细的解说。
作者: swswsw129 (How majestic the night)   2024-11-05 06:19:00
推详细
作者: AoWsL (AoWsL)   2024-11-05 07:01:00
好酷哦 中途跑外送放弃一阵子没想到这么复杂
作者: chiekat (chiekat)   2024-11-05 07:22:00
pony 海一样lora多少能补一下自身的缺陷吧,每天civitai上仍是一堆新lora冒出来
作者: purplvampire (阿修雷)   2024-11-05 07:33:00
作者: balabala56 (巴拉巴拉)   2024-11-05 07:35:00
内容好多 推推
作者: andyching168 (andyching168)   2024-11-05 07:53:00
我满好奇,以前1.5的lora在SDXL还能用吗另外现在SDXL在12G的3060不知道还跑不跑得动
作者: clubee (柏拉)   2024-11-05 08:00:00
推 你是AI绘图史官吧
作者: ryo1008 (Yu_BeeR)   2024-11-05 08:04:00
感谢 最近开始玩AI 解开了不少疑问
作者: v86861062 (数字人:3)   2024-11-05 08:07:00
赞赞赞
作者: ETTom (喵)   2024-11-05 08:18:00
这篇也太专业了吧 推一下
作者: denny8437 (MosBaka)   2024-11-05 08:20:00
专业推
作者: qd6590 (说好吃)   2024-11-05 08:21:00
哇 太专业
作者: protoss97 (wei)   2024-11-05 08:25:00
推专业
作者: tiger870316 (Chien)   2024-11-05 08:29:00
太认真了吧
作者: joeii0126 (铜学)   2024-11-05 08:30:00
好厉害啊
作者: longkiss0618 (剑舞北极)   2024-11-05 08:35:00
大师
作者: jafifshn4   2024-11-05 08:36:00
好专业的文
作者: naya7415963 (稻草鱼)   2024-11-05 08:43:00
如果图片是人上传的,那种号称有防ai学习技术的平台其实根本没有用吧...
作者: sudekoma (′・ω・`)   2024-11-05 08:46:00
(′・ω・`)小偷都会笑别人上的锁没用但是你加了一道烂锁害小偷不能直接进去,他就会碎念(′・ω・`)比如你家又没有什么好偷之类的
作者: Dayton (今夜如此,夜夜皆然。)   2024-11-05 09:36:00
这篇太优秀了
作者: nelson220011 (nnnelsonnn)   2024-11-05 09:48:00
感谢分享
作者: EvilKnight (邪黯)   2024-11-05 10:10:00
推推
作者: GeorgeBear (熊乔治)   2024-11-05 10:27:00
感谢分享
作者: tom50512 (空心菜)   2024-11-05 10:35:00
大师
作者: waynemayday (维尼)   2024-11-05 10:47:00
好像在看AI图进化史 真的是越来越难分辨
作者: kuochuwon (黑轮桑~ YO)   2024-11-05 10:53:00
感谢科普
作者: salamender (banana king)   2024-11-05 10:54:00
没想到大大还是个大咒术师
作者: bluejark (蓝夹克)   2024-11-05 12:40:00
你有去恶补了吗= =看了之后有看到有人会讲成拼图吗
作者: owlman (★~Born To Be Epic~★)   2024-11-05 13:01:00
用pony忽然感觉ai听懂人话了整个惊讶感到现在还很鲜明

Links booklink

Contact Us: admin [ a t ] ucptt.com