Re: [闲聊] AI画图是不是大数据拼图?

楼主: smart0eddie (smart0eddie)   2022-10-07 03:17:13
※ 引述《yoyololicon (十年魔乃粉)》之铭言:
: Q: CNN的filter是找最常出现的pattern,所以有用到其他图的资讯去拼贴!
: A: Also nonsense。
: 如果今天CNN只有一层,那还有一点道理。
: 但一到两层以上,这些Hidden feature所在的空间和原本资料所在的空间已经是不同的了
: 要说拿图去拼贴非常牵强。
https://sporco.readthedocs.io/en/latest/examples/dl/bpdndl.html
https://i.imgur.com/5WkUnQm.png
很久以前有人发现图像可以拆解成直线 圆圈等等很小的基本图样来表示
用这些基本图样可以组成各式各样的图
https://dl.acm.org/doi/pdf/10.1145/1553374.1553463
https://i.imgur.com/1uTkWmJ.png
加了噪声以后的图会跟基本图样有一点点不太一样
以前做去噪声的其中一派方法就是去找到最相近的基本图样组合贴上去
不过这个是只看一层
https://youtu.be/8zomhgKrsmQ
https://i.imgur.com/LCncLU2.png
https://i.imgur.com/9ImcgXN.png
而deep learning
其中一派想要做的是先让encoder认出图上是什么东西
用一个code 代表
例如可能用7474代表猫 1314代表狗
再把他辨认出的东西用decoder画出来
https://cs231n.github.io/understanding-cnn/
https://i.imgur.com/PsH7M27.png
那convolutional encoder 怎么辨认的?
有些人画过他学出来的东西
可以看到一样也是会学到各种直线圆圈的基本图样
去侦测图上有没有直线 有没有圆圈
第二层是在第一层侦测的结果去侦测直线/圈圈
实质等同看原图有没有什么直线圈圈的特殊组合
一层一层叠下去
最后可能可以等同让他去侦测到有没有猫耳朵之类的东西
https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Noh_Learning_Deconvolution_Network_ICCV_2015_paper.pdf
https://i.imgur.com/LRYZhAH.png
https://i.imgur.com/UJoLCLT.png
那有了code以后要怎么生出图呢
有人提出了deconvolution 简单说是逆向 convolution
convolution 是侦测有没有特定形状 有的话给个分数
deconvolution 则是看分数决定特定形状在图上要多明显
一层一层回来就可以慢慢生出你要的图
所以如果要例如某鸡坚持只是拼贴
用极端高标准去硬凹
的确有一部分模型是会从训练用的图里面学到基本图样
再利用这些基本图样组合出图
但是以同样标准看人类绘师
人类一样也是学到各种基本图样
再利用基本图样组合成图
你不可能说你的图绝对拆不出直线 拆不出圈圈 拆不出点
https://drive.google.com/file/d/1DYHDbt1tSl9oqm3O333biRYzSCOtdtmn/view
https://i.imgur.com/rwIbf4L.png
https://i.imgur.com/ZwwZPXO.png
difusion model 的核心想法倒是不一样
他不是去猜原本图是什么
而是去猜你加了什么噪声点上去
把这些噪声点扣掉
这个要怎么帮某鸡凹成拼贴就留给大师们想办法了
我猜会有人直接end了
屁话这么多谁看得完
反正管他图怎么出来的
有色图看就好
对啊
那就来看绘师画的合法萝吧
https://www.pixiv.net/users/60001492
https://www.pixiv.net/artworks/101734790
https://pixiv.cat/101734790.jpg
https://www.pixiv.net/artworks/101637298
https://pixiv.cat/101637298.jpg
https://www.pixiv.net/artworks/101657105
https://pixiv.cat/101657105.jpg
https://www.pixiv.net/artworks/101690581
https://pixiv.cat/101690581.jpg
https://www.pixiv.net/artworks/101702984
https://pixiv.cat/101702984.jpg
9000 岁岁了 safe~
作者: doramon888 (贝尔汪)   2022-10-07 03:18:00
可爱~
作者: yoyololicon (萝莉大好)   2022-10-07 03:25:00
sparse coding 太怀念了吧
作者: nilr   2022-10-07 03:28:00
作者: wahaha99 (此方不可长)   2022-10-07 04:03:00
作者: Vulpix (Sebastian)   2022-10-07 04:24:00
well... May it be viewing as an interpolation in the"good" space of images?
楼主: smart0eddie (smart0eddie)   2022-10-07 08:33:00
请问您是指哪项
作者: leo125160909 (中兴黄药师)   2022-10-07 09:05:00
你觉得这个未来能取代GPU吗? https://youtu.be/GVsUOuSjvcghttps://youtu.be/GVsUOuSjvcg
楼主: smart0eddie (smart0eddie)   2022-10-07 10:03:00
可能可以也可能不行吧 跟薛丁格的猫一样

Links booklink

Contact Us: admin [ a t ] ucptt.com