楼主:
Satoman (沙陀曼)
2023-11-25 22:46:18→ guogu: 不过我也不知道它怎么练的 只有约100张图的角色11/24 22:25
→ guogu: 它也可以画的很精准 只知道v3是基于sdxl11/24 22:25
昨天本来想讲,只不过用推文讲有点麻烦 ==
其实这也算是一个常见的误解:
就是AI要将一个人物“学得像”需要大量、精致的图片作为资料。
但是实际上,如果只是要“学得像”那其实只要不到10张图片就能办到了。
而且图片不用特别精致,或者说某些特别精致的图片反而会有反效果。
对AI来说,要学习一个人物比较需要的是能精确呈现角色特征,
用色和线条分明的图片。
最符合以上需求的图片是什么?
对,动画的截图。
我举个比较极端的例子来讲:
https://i.imgur.com/RUAphDb.jpg
这是我自己练出来的早坂妈LORA产出来的图。
这个角色在动画里出场只有5分钟左右,当然也没有什么同人图。
可是LORA模型一样可以把这个角色给练出来。
我的给它学习的基本学习资料就长这样:
(搞了好几个不同的版本,可能不是这个资料夹 ==)
https://i.imgur.com/AGDXoGV.jpg
https://i.imgur.com/hpiG4TO.jpg
除了两张我预先学习的AI图,其他就是那5分钟的动画截图 ==
LORA模型的原理是污染干涉原本底模的生图结果,
所以“学得像”为前提的话它只要动画截图就够了。
但是大部分玩AI的人不会满足于学得像,而是希望这个角色能摆一些原本看不到的姿势,
做一些原本看不到的动作。
讲白一点就是10个玩AI的有9个会拿来搞色色的东西,
最起码也要能换一些色色的衣服。
这样问题就来了,AI在只有少数几张图的情况下学习不到,
因为它的资料只被限制在那几张图中,所以也只会做那几个动作。
用比较专业的术语来讲叫做“过拟合”,白话文就是“学太像”。
这个时候大量图片学习的优势就出来了。
如果有50张图片,并且风格没有过于牴触的话,
那AI就会知道你想训练的东西不是一个站挺挺的人物,
而是一个人物能根据TAG摆出不同的姿势,甚至是换成不同的衣服。
甚至在超过200张图片的情况下,我的经验是也不太需要担心风格牴触的问题,
因为这问题会被大量的资料本身淡化至可以忽略的程度。
那冷门角色是不是就真的没救?
也不是。
https://i.imgur.com/KmkMk7r.jpg
https://i.imgur.com/zWmq9AS.jpg
我这个早坂妈就练出了可以让角色回头张望或坐下平躺之类的基本动作。
因为AI学习中有个方法叫“正则化”可以给AI补习,让它学习到其他的概念。
简单来讲,就是在训练时丢一些其他图片给它一起学习。
现在开源的LORA训练脚本都有正则化的选项可以勾选。
但是那个正则化用起来怪怪的,现在很多人其实是手动处理。
以这个早坂妈的LORA来讲,我正则化是先加上了一堆无头裸女的图片一起学习。
像是这种:
https://iili.io/JoN1Cnj.png
这个方法我是从一个中国人那边抄来的。
我本来是用学习衣服的方法,添加各种衣服的去头图片来学习,
但是后来才发现这种裸女去头法更简单粗暴。
因为我把头涂黑了,人物又是裸体,所以AI就只会学习动作而不会污染我原本学习资料。
然后我又感觉长裙的头身比例经常出错,
因为原本资料几乎都上半身,缺少全身图让AI认识正确的头身比例。
所以我想了一下,又很简单粗暴的加上了一组资料给它学习:
https://i.imgur.com/r2ZR5qS.jpg
对,我把早坂爱的头砍了下来,只留穿长裙的身体给AI学习身体比例。
如此一来AI大概知道角色的头身比例,
还有个附加优点是这个LORA的早坂妈可以换穿她女儿的衣服。
https://i.imgur.com/ufyeZq4.jpg
当然,要换一些色色的衣服也不成问题。
https://iili.io/JoNwUJf.jpg
简单来讲,要让LORA模型学习角色图片的数量其实本身不是必要条件,
而动画截图其实是学习人物最优秀的原料 ==
所以现在模型网站CIV上最多的就是各类动画人物,新番人物也是一堆人抢著练 ==
譬如说这季的福利莲制作精良、用色分明、线条简洁,学习起来效果就很好。
所以几乎每个女角都是一堆模型。
像是尸骨未寒的阿乌拉和莉妮耶,挂掉后她们马上就被分尸练成LORA了 ==
https://i.imgur.com/jRkyASl.jpg
https://i.imgur.com/z2LAG2I.jpg
所以回到正题,NovelAI的人物和画风模型是哪来的?
最直接的想法就是他们内部有人在专门练各类画风和角色LORA让使用者使用。
另一种想法就是他们也干了其他公开的LORA来用,
只不过这些LORA本来就是基于他们前泄漏模型来训练的,也算是鲑鱼回乡。
但是不管是哪种,图片数量其实都不是大问题。
100张图片对于练成人物LORA来讲完全是绰绰有余,
对我这个专门截图练冷门人物自爽的人来讲是甚至有点奢侈。
至于营利问题吗,目前基本上无解。
因为除了ADOBE我相信他的图库是相对没问题的之外,
其他的AI模型应该都有用非正当手法取得学习资料的问题。
以最流行的开源的stable diffusion底模来讲,他使用的图库来源本身就并非正当授权。
更别提构成现在宅图根基的NovelAI模型,那是直接拿盗图网站在作训练的。
换句话说扣除ADOBE之外,AI图和模型本身大多没有一张是清白的,
基本上都是盗图产物。
要说这是引发产业革命的蒸汽机?
以目前来看来比较像是比较像是引发混乱的产业废弃物 ==
只是这废弃物目前对我来讲还有玩乐的用途,偶尔想“用”某个角色时可以不求人罢了 ==
作者:
guogu 2022-11-24 22:25:00不过我也不知道它怎么练的 只有约100张图的角色它也可以画的很精准 只知道v3是基于sdxl
作者:
Sessyoin (杀生院祈荒)
2023-11-25 22:49:00请给我更多AI色图 我要做研究
作者: SunnyBrian (人気薄二冠马) 2023-11-25 22:50:00
请问收现金袋吗?
作者:
Lisanity (桃园刘在石)
2023-11-25 22:52:00太认真了吧 XD 推
作者:
spfy (spfy)
2023-11-25 22:52:00早坂爱:????????
然后发现自己喜欢的冷门角有人做AI色图是蛮开心的XDD
作者:
lsd25968 (cookie)
2023-11-25 22:54:00翼龙你data set太小的话有试过data argument吗?
楼主:
Satoman (沙陀曼)
2023-11-25 22:56:00我通常是手动处理去转转翻翻,让他图片看起来是不同张
作者:
lsd25968 (cookie)
2023-11-25 22:57:00有很多可以弄 DL的时候水平翻转 旋转 alpha值 伸缩 剪裁啥的
楼主:
Satoman (沙陀曼)
2023-11-25 22:58:00我没试过,主要还是dataset每几张的话自己手动调就好了像是全身图我通常会顺手裁成三到四张图
作者:
lsd25968 (cookie)
2023-11-25 23:00:00哦哦 数量少所以干脆手动就是了
楼主:
Satoman (沙陀曼)
2023-11-25 23:00:00对啊,本来就没几张整理的时候顺便调一下就好
作者:
lsd25968 (cookie)
2023-11-25 23:02:00毕竟资料集太小造成的overfitting 最直观解法就是扩大资料集(`・ω・′)
楼主:
Satoman (沙陀曼)
2023-11-25 23:03:00断头法其实很好用,看到服装类似但是用TAG区分的也可以用
作者:
lsd25968 (cookie)
2023-11-25 23:03:00只是凑一脚谈谈 没实际玩过AI产图就是
楼主:
Satoman (沙陀曼)
2023-11-25 23:04:00stable diffusion的webui有内建一个翻转功能我自己是没用直接用过,因为还是有人物左右不对称的问题
作者:
lsd25968 (cookie)
2023-11-25 23:05:00原来如此(′・ω・`)
作者:
lolicat (猫雨果)
2023-11-25 23:16:00难怪最近阿乌拉的图大量发生...
作者: AirForce00 (丹阳P) 2023-11-25 23:29:00
推讲解
作者:
JohnShao (平凡的约翰)
2023-11-25 23:37:00断头法学习的身体如果画风差异仍然偏大不会污染吗
但所谓学得像还是蛮主观的 图提供的资讯少姿势一变就歪衣服到现在训练有完整重现的吗 好像还是会是微妙的不同
楼主:
Satoman (沙陀曼)
2023-11-25 23:50:00严格来讲不是加,是在过程中污染就是了完整重现就看本身衣服复杂度和抽卡数量
作者:
guogu 2023-11-26 00:09:00我的意思是如果只有100张的图他们都特地练出来那样总共需要的工程量未免也太大了
楼主:
Satoman (沙陀曼)
2023-11-26 00:10:00现在一堆人用脚本和AI再练AI,其实还好CIV上也有一堆用AI练AI产生的模型,人类从头到尾不用介入
真是好研究~~~~推推阿乌拉也是为了研究AI才成为断头台的阿乌拉
作者: aquacake 2023-11-26 01:55:00
喜欢的冷门角色能自己产真的挺开心的
作者:
Innofance (Innofance)
2023-11-26 02:37:00老哥,如果我想要训练某个画风的模型要多少图才够
楼主:
Satoman (沙陀曼)
2023-11-26 02:53:00不一定,大部分的人都是能多少就丢多少,再看情况调整通常是选看起来差异性比较大的图片,除非你有想搞脚色包
作者:
iamnotgm (ä¼½è—之黑)
2023-11-26 03:05:00推
作者:
Wangdy (蒙古人)
2023-11-26 06:38:00貌强只推
作者:
alpho (Whyyyyy)
2023-11-26 06:46:00原来还有这种方法 感谢分享
作者: Gjerry 2023-11-26 06:56:00
资料原则上越多越好,多还可以想怎么调整,少就比较麻烦
作者:
louner (louner)
2023-11-26 07:31:00推 能自己画冷门角色的图真的棒 但之前试的感觉是用文字还是很难控制图的内容 controlnet+使用者有绘画底子才能真的释放这类model的潜力另外砍头那召真有趣XD 搞不好之后会有人释放砍头数据集
作者:
ddd852 (123站着穿)
2023-11-26 08:20:00瑟瑟!
作者:
bnn (前途无亮回头是暗)
2023-11-26 11:04:00确实是接头霸王 但AI会帮你P的还把接头医治好一致性
作者:
timmy999 (愤怒a阿宅)
2023-11-26 11:56:00好奇那个txt档是什么?