Re: [爆卦] AlphaGo发现自己79步失误

楼主: tlchen (台湾加油)   2016-03-13 18:53:46
※ 引述《tsppajrdrrfs ()》之铭言:
: ※ [本文转录自 Gossiping 看板 #1MvIov-I ]
: 作者: n91324 (不丹) 看板: Gossiping
: 标题: [爆卦] AlphaGo发现自己79步失误
: 时间: Sun Mar 13 17:02:45 2016
: Deep Mind 创办人在推特表示
: Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
: 所以AG确实在79有失误
: 而且她下到87才发现自己之前的失误
: 补上推特:
: 推 OrzJ: https://twitter.com/demishassabis 推特
从这两个 twitter 来看, AI 在 79 时仍认为自己有 79% 的胜率,
直到第 87 手时,才发现胜率骤降。四日棋迷猜测如下:
AI 估计胜率是经由之后的模拟,白 78 手被认为神手,但或许是之后
的巧妙变化是不明显的,所以 AI 无法知道这手有这么大的功用,或
是说,无法准确的评估此时的盘面。
要知道,AI 的估算是根据之后的模拟,它并没有人类逻辑式的推演,
所以它不见得能得到之后的最佳变化。某种意思下,它是取模拟的加权
平均,但只要之后最佳的应对没被模拟到,它的评估自然不准。又或者
是,最佳应对跟其它应对方的结果差很多,若不能给最佳应对接近 1
的权重,那它的评估就失准。
而随着棋局变化,又多下了几手,能变化的地方变少,AI 自然比较能
模拟到正确的应对,才惊觉自己已经落后。
这提供了要对付目前这版 AlphaGo 的方法,你最好下一些方法是:接
下来对你的最佳解跟次佳解,结果会差很多,这样 AI 用模拟的,就有
机会误判。如果你下的棋,接下来的应对,结果都差不了太多,那 AI
自然估得准。让它估不准,才会在接下来还没估准前,继续出错。
作者: kingrichman (silent all these years)   2016-03-13 18:55:00
AI遇到没遇过状况,但这次他就记起来了相同的招以后想再用就没用了
作者: aegis43210 (宇宙)   2016-03-13 18:57:00
所以由此可见得黑77手那时,alphaGO的胜算有多大…
作者: ilw4e (可以吃吗?)   2016-03-13 19:00:00
他胜算大是认定他跑的图都把白吃光了吧,暴动手筋没算到
作者: wnglon (冷面笑匠)   2016-03-13 19:01:00
不一定 如果稍微改变几个棋子 BUG还是存在 因为这是程式阿必须根本性解决这问题
作者: indium111 (#ttyhg)   2016-03-13 19:01:00
那时候直播的职业棋手几乎都认为李快要四连败了直到李世石78的神之一手才逆转大家的看法
作者: Uizmp (黑袍法师)   2016-03-13 19:05:00
既然有所谓的胜率, 就有被AG认为会败的招
作者: derekhsu (華麗的天下無雙)   2016-03-13 19:06:00
AlphaGo不能即时学习要重新训练
作者: Uizmp (黑袍法师)   2016-03-13 19:07:00
很有可能在78手起连续被打在AG评估会败的地方导致胜率狂掉
作者: JDKnife (绝地小刀)   2016-03-13 19:07:00
最好是逆转...那边本来就有手段 不只78那个位置
作者: Uizmp (黑袍法师)   2016-03-13 19:08:00
到87手的时候 AG 发现自己的胜率掉到某个门槛以下
作者: siyaoran (七星)   2016-03-13 19:08:00
是逆转吧 电脑胜率从79%掉 还有职九们觉得李要输了
作者: aegis43210 (宇宙)   2016-03-13 19:08:00
有比挖更好的下法吗?这一步李世石想了十五分钟的说
作者: siyaoran (七星)   2016-03-13 19:09:00
依照古力和柯洁的下法明明就还差很多
作者: BusterPosey (Barca!Giants!Rafa!)   2016-03-13 19:09:00
版上有不世出的高手啊 请赐教
作者: deacon (deacon)   2016-03-13 19:10:00
这手很明显连alphago也没算到 不然后面不会崩溃那么明显
作者: NaoGaTsu (那欧卡兹)   2016-03-13 19:10:00
78手改下靠的话,结果真的难料...
作者: siyaoran (七星)   2016-03-13 19:16:00
AI不能快速从错误中学习的确还有一大段路要走
作者: DemonElf (LdsFish)   2016-03-13 19:29:00
Alphago之所以有别于以往的围棋AI就是他能学习成长好吗
作者: smallyuki (smallyuki)   2016-03-13 19:32:00
觉得要逼狗犯无可挽回的大错有两个条件第一是极佳的妙手,第二是这一手远超出狗的预期范围
作者: DemonElf (LdsFish)   2016-03-13 19:37:00
李能下出超出预期的这一手真的是很难得,别忘了Alphago已经自我对奕超过三千万盘棋
作者: Uizmp (黑袍法师)   2016-03-13 19:52:00
其实也有个吊诡的地方, 胜率接近八成 代表还有两成可破说不定2成中就会有像今天这种一下子把胜率压到很低的走法
作者: danibaba5566 (BABA56)   2016-03-13 20:10:00
78手确实是手筋
作者: utap2001 (寻找一个漫长的答案 )   2016-03-13 20:39:00
李也说78手是唯一一手 所以他也知道他那时候胜率有2成而2成的胜率就要从这里突破 他跟alphago想的都一样
作者: mothertime (我超爱傅红雪这变态)   2016-03-13 21:45:00
alphago好像不会记得这几盘棋
作者: fywei (应无所住而生其心)   2016-03-13 22:28:00
软件用的是大数据training 不会去特别对应某种情况

Links booklink

Contact Us: admin [ a t ] ucptt.com