Re: [转录] “战胜自己”对于AlphaGo而言不只是口号

楼主: mgdesigner (機槍設計師)   2016-03-14 15:12:29
※ 引述《Tkuei (it's me)》之铭言:
: 这是台大资工林守德老师在他FB写的一篇文章,是他看过Nature那篇论文之后写的感想
: 个人认为高手解读应该有助于厘清大家对AlphaGo行为模式的理解
: 原文连结:https://goo.gl/m8cBHn (FB连结,不喜误入)
小弟是programmer,也是业余围棋的爱好者,看了这几天的直播,忍不住发一点自己的心
得。
我在看过论文以后,我觉得用更通俗的方法来描述AlphaGo,应该说他已经不是传统上认定
的电脑AI,而是一个人,而这个“人”,靠着超强记忆力,在短短二年里,经历了可能千
年的玩棋历程,有着超强的直觉。
他就从头到尾用超强的记忆力,靠着直觉在下棋,甚至不懂规则。这意思是说,搞不好如
果有低等但神经元多且长寿的生物,我们把他抓来,把他的大脑接上电子讯号控制,把他
的视觉感官接成电脑棋盘,动作神经接键盘,让他可以下棋,下得好给食物奖励,下不好
给惩罚(AlphaGo的神经网络训练是有奖励,但是有没有惩罚我就不知道了),也许这样
的生物也可以练出不低的棋力,例如说章鱼的神经元有五亿个(人脑有1000亿个以上),
专心练棋,搞不好比AlphaGo的运作成本还低XD
AlphaGo的价值或者说其恐怖,就是他已经具备类似人类的直觉,哪一天他要来画画还是写
音乐,搞不好都有可能发生,你要说他有没有情感,搞不好可能也算有了,就是在上一盘
他发现下错棋,开始胡乱乱下,可能就是,也许AlphaGo以后应该作一个萤幕,显示他认为
当下胜率多少,胜率高就是很开心的脸,胜率低就是苦瓜脸,当某一棋对手下出Alphago无
法应,乱硬的时候,开心的脸瞬间变苦瓜脸,你就知道他的情绪了。XD
其实应该作这个,才公平,因为李九段的心情情绪大家都看得到,可是AlphaGo的心情(胜
率)大家又看不到,这真的不公平。
跟AlphaGo不同的是,人类下棋是直觉跟逻辑并行的,好的职业棋手知道何时要切换,Alph
-aGo的状况是,这一位“棋手”他不是逻辑不好完全依赖感觉行事,就是这一盘没有掌握
到切换的时机,该拼逻辑的时候,他却还在靠感觉,有点像是完全靠感觉开车,一但感觉
出错,就歇斯底里,发生意外那样XD
AlphaGo已经被训练成这样感觉派的了,昨天也不能说那是bug,比较可能说是一个“千年
老人”棋士下棋的坏习惯终于被抓到了。那将来Google的下一个围棋人工智能,BetaGo、
GamaGo会不会换不同的“训练法则”,来训练神经网络变出不同的棋风呢?值得期待。
一点心得分享XDXD
作者: oops66 (误导给宠物!)   2016-03-14 15:15:00
李40虽然情绪大家看的到 但是alphaGO又不看 这种情况下把alphaGO的情绪显现出来给李40看 才是不公平吧
作者: darkseer   2016-03-14 15:17:00
这个太超自然了啦...你要讲也要连结到算法吧@@
作者: profyang (prof)   2016-03-14 15:19:00
情绪看不看的倒不是重点 但是李世石情绪会波动 但阿发够其实就是根据你讲的情绪来下棋的 这是他最大的优势*李世石情绪波动会影响他下的棋的好坏
作者: Marino (马利诺)   2016-03-14 15:32:00
那不是直觉 就是网络架构加上已经训练好的权重而已其实google可以办一场alphgo A跟alphgo B下棋 看会怎样
作者: ckWade (只好喜欢自己)   2016-03-14 15:35:00
办了几千万场了,只是没公开而已
作者: indium111 (#ttyhg)   2016-03-14 15:41:00
其实已经有AI可以制作音乐了,创作不再是人类所独有而电脑的电晶体数量很快就会追上人脑的神经元数量现在的电子人脑思考速度大概是人脑的1/1000,如果摩尔定律不变,大概40年后,电子脑就跟人脑拥有相同速度^打错,应该是20年后
作者: goldduck (哥达鸭)   2016-03-14 15:50:00
应该给大家看不给李看
楼主: mgdesigner (機槍設計師)   2016-03-14 15:55:00
同意楼上
作者: iamstudent (stu)   2016-03-14 15:56:00
我也希望看到alphaGo的情绪,帮它做个脸吧 XD
作者: profyang (prof)   2016-03-14 15:57:00
对耶 给大家看好像不错
作者: indium111 (#ttyhg)   2016-03-14 16:11:00
要做出情绪应该不难,胜率低时苦恼表情,高时轻松表情随机乱数,偶尔做出跟胜率相反的欺敌表情,够拟真了吧
作者: goldduck (哥达鸭)   2016-03-14 16:14:00
看的懂的骗不了人
作者: indium111 (#ttyhg)   2016-03-14 16:16:00
看得懂的人才会对欺敌表情绝得困惑啊明明AG都快输了为什么表情一脸轻松,会想自己是否漏算https://youtu.be/7Pq-S557XQU AI的介绍(有中文字幕)看完影片你会觉得自己快变成nothing了
作者: broodworld (john)   2016-03-14 16:20:00
人脑还是有效率很多,李世石下过的棋少电脑很多
作者: WuDhar (was eliminated)   2016-03-14 17:17:00
楼上定义很怪,怎么不说三个月就能赢九段的这种效率?
作者: chris610020 (可悲的阿明)   2016-03-14 17:41:00
人脑反而没效率吧,人脑最重要的事情是活着,光是这项就要花1/3时间去睡觉,还要吃喝拉撒,就算在下围棋用到的部分顶多就10%,其他90%zj负责生存阿法狗就只做一件事就是算围棋,而且不会死阿
作者: arcworld (人生究竟是什么呢?)   2016-03-14 17:53:00
后面那几手乱下对AG来说不是乱下,但对人来说是乱下如果是乱下的棋,小李一一照应会不会很奇怪?他可以不理所以AG在赌小李不会应手,都应完,AG就投降了,因为没棋赌这种机率为0的棋,对人当然是乱下,但AG哪知道机率0?AG有评估对方应手机率的函式吗??
作者: broodworld (john)   2016-03-14 20:16:00
我是说下几盘棋可以到职棋所以一样多的神经元不见得可以做到一样多的事越不接近暴力法就越有效率,像穷举到类神经
作者: Maybetrue (已婚)   2016-03-14 23:34:00
你的解释相当的有意思,完全靠“棋感”,而且看起像细算的地方,其实也是靠感觉。也就是看机率,说难听一点就是:大概这样下会赢。
楼主: mgdesigner (機槍設計師)   2016-03-15 00:42:00
是的这就是他算法的主轴。

Links booklink

Contact Us: admin [ a t ] ucptt.com