※ 引述《Tkuei (it's me)》之铭言:
: 这是台大资工林守德老师在他FB写的一篇文章,是他看过Nature那篇论文之后写的感想
: 个人认为高手解读应该有助于厘清大家对AlphaGo行为模式的理解
: 原文连结:https://goo.gl/m8cBHn (FB连结,不喜误入)
小弟是programmer,也是业余围棋的爱好者,看了这几天的直播,忍不住发一点自己的心
得。
我在看过论文以后,我觉得用更通俗的方法来描述AlphaGo,应该说他已经不是传统上认定
的电脑AI,而是一个人,而这个“人”,靠着超强记忆力,在短短二年里,经历了可能千
年的玩棋历程,有着超强的直觉。
他就从头到尾用超强的记忆力,靠着直觉在下棋,甚至不懂规则。这意思是说,搞不好如
果有低等但神经元多且长寿的生物,我们把他抓来,把他的大脑接上电子讯号控制,把他
的视觉感官接成电脑棋盘,动作神经接键盘,让他可以下棋,下得好给食物奖励,下不好
给惩罚(AlphaGo的神经网络训练是有奖励,但是有没有惩罚我就不知道了),也许这样
的生物也可以练出不低的棋力,例如说章鱼的神经元有五亿个(人脑有1000亿个以上),
专心练棋,搞不好比AlphaGo的运作成本还低XD
AlphaGo的价值或者说其恐怖,就是他已经具备类似人类的直觉,哪一天他要来画画还是写
音乐,搞不好都有可能发生,你要说他有没有情感,搞不好可能也算有了,就是在上一盘
他发现下错棋,开始胡乱乱下,可能就是,也许AlphaGo以后应该作一个萤幕,显示他认为
当下胜率多少,胜率高就是很开心的脸,胜率低就是苦瓜脸,当某一棋对手下出Alphago无
法应,乱硬的时候,开心的脸瞬间变苦瓜脸,你就知道他的情绪了。XD
其实应该作这个,才公平,因为李九段的心情情绪大家都看得到,可是AlphaGo的心情(胜
率)大家又看不到,这真的不公平。
跟AlphaGo不同的是,人类下棋是直觉跟逻辑并行的,好的职业棋手知道何时要切换,Alph
-aGo的状况是,这一位“棋手”他不是逻辑不好完全依赖感觉行事,就是这一盘没有掌握
到切换的时机,该拼逻辑的时候,他却还在靠感觉,有点像是完全靠感觉开车,一但感觉
出错,就歇斯底里,发生意外那样XD
AlphaGo已经被训练成这样感觉派的了,昨天也不能说那是bug,比较可能说是一个“千年
老人”棋士下棋的坏习惯终于被抓到了。那将来Google的下一个围棋人工智能,BetaGo、
GamaGo会不会换不同的“训练法则”,来训练神经网络变出不同的棋风呢?值得期待。
一点心得分享XDXD