http://i.imgur.com/6gPZ2d8.jpg
先让我们假设一下
阿布德尔是一个没看过青蛙(活的、死的、绘画、雕塑等都没有)的人,请问他画得出青蛙的样子吗?
没办法对吧?
现在我们给阿布德尔一张青蛙的照片,然后请他画青蛙。他大概就只能画出同样角度、同样品种的青蛙。
这个时候,岸边露伴走了过来,他不仅看过活的青蛙、看过无数生物图鉴,甚至连青蛙都舔过了,于是他随手都能画出青蛙,甚至是咖啡雕花雕只青蛙都可以。
岸边露伴能够画出各种青蛙,不是因为他在画青蛙之前深思熟虑,而是因为他经验了许多不同的青蛙,并统整出一种“青蛙”的特征规则,所以他能画出各种形式的青蛙。
生成式AI就是以类似方式“学习”(电脑本身并不能理解概念,AI是在模仿理解概念后的结果)
我们为什么需要给训练用的图片上标签,就是要让AI知道说这些图片具有“青蛙”的概念,然后藉著计算机的算力,把噪声变成接近“青蛙”的概念结果。
为什么说标签重要,因为AI如果只学过“青蛙”而没学过“青”或“蛙”,因为它只能模拟理解概念的结果而不是理解概念,它就没办法好好地画出“黑蛙”,或是“青天”,所以说AI自始至终都是在“猜”答案、背公式,它从没理解过概念原因(也无法理解)
而当我们人类要做拼贴图的时候,我们是在完全理解概念并作出再诠释概念的复杂行为。
亿泰很喜欢上美劳课,老师会给他一叠过期杂志,让他用上课时间拼贴出他想要的作品。亿泰很想念哥哥,所以他撕下赛车杂志的车轮当作哥哥的眼睛、又撕下名模杂志的头发、电影杂志的海报标语等等,拼出哥哥的身体和衣服。
这就是亿泰清楚那些东西的形状概念、颜色概念甚至是材质概念后,透过他的重新诠释而做出的、他的哥哥形兆的样貌。
除非下非常清楚的prompt指定AI要用车轮当作眼睛,否则AI不会生成出车轮样子的眼睛。再次强调AI只能模仿理解概念后的结果,它无法做出依靠概念去再诠释的行为,但这正是拼图所必须的能力