Re: [爆卦] AlphaGo发现自己79步失误 tlchen PTT批踢踢实业坊

Re: [爆卦] AlphaGo发现自己79步失误

楼主: tlchen (台湾加油) 2016-03-13 18:53:46

※ 引述《tsppajrdrrfs ()》之铭言：
: ※ [本文转录自 Gossiping 看板 #1MvIov-I ]
: 作者: n91324 (不丹) 看板: Gossiping
: 标题: [爆卦] AlphaGo发现自己79步失误
: 时间: Sun Mar 13 17:02:45 2016
: Deep Mind 创办人在推特表示
: Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
: 所以AG确实在79有失误
: 而且她下到87才发现自己之前的失误
: 补上推特:
: 推 OrzJ: https://twitter.com/demishassabis 推特
从这两个 twitter 来看， AI 在 79 时仍认为自己有 79% 的胜率，
直到第 87 手时，才发现胜率骤降。四日棋迷猜测如下：
AI 估计胜率是经由之后的模拟，白 78 手被认为神手，但或许是之后
的巧妙变化是不明显的，所以 AI 无法知道这手有这么大的功用，或
是说，无法准确的评估此时的盘面。
要知道，AI 的估算是根据之后的模拟，它并没有人类逻辑式的推演，
所以它不见得能得到之后的最佳变化。某种意思下，它是取模拟的加权
平均，但只要之后最佳的应对没被模拟到，它的评估自然不准。又或者
是，最佳应对跟其它应对方的结果差很多，若不能给最佳应对接近 1
的权重，那它的评估就失准。
而随着棋局变化，又多下了几手，能变化的地方变少，AI 自然比较能
模拟到正确的应对，才惊觉自己已经落后。
这提供了要对付目前这版 AlphaGo 的方法，你最好下一些方法是：接
下来对你的最佳解跟次佳解，结果会差很多，这样 AI 用模拟的，就有
机会误判。如果你下的棋，接下来的应对，结果都差不了太多，那 AI
自然估得准。让它估不准，才会在接下来还没估准前，继续出错。

作者: kingrichman (silent all these years) 2016-03-13 18:55:00

AI遇到没遇过状况，但这次他就记起来了相同的招以后想再用就没用了

作者: aegis43210 (宇宙) 2016-03-13 18:57:00

所以由此可见得黑77手那时，alphaGO的胜算有多大…

作者: ilw4e (可以吃吗？) 2016-03-13 19:00:00

他胜算大是认定他跑的图都把白吃光了吧，暴动手筋没算到

作者: wnglon (冷面笑匠) 2016-03-13 19:01:00

不一定如果稍微改变几个棋子 BUG还是存在因为这是程式阿必须根本性解决这问题

作者: indium111 (#ttyhg) 2016-03-13 19:01:00

那时候直播的职业棋手几乎都认为李快要四连败了直到李世石78的神之一手才逆转大家的看法

作者: Uizmp (黑袍法师) 2016-03-13 19:05:00

既然有所谓的胜率, 就有被AG认为会败的招

作者: derekhsu (è¯éº—çš„å¤©ä¸‹ç„¡é›™) 2016-03-13 19:06:00

AlphaGo不能即时学习要重新训练

作者: Uizmp (黑袍法师) 2016-03-13 19:07:00

很有可能在78手起连续被打在AG评估会败的地方导致胜率狂掉

作者: JDKnife (绝地小刀) 2016-03-13 19:07:00

最好是逆转...那边本来就有手段不只78那个位置

作者: Uizmp (黑袍法师) 2016-03-13 19:08:00

到87手的时候 AG 发现自己的胜率掉到某个门槛以下

作者: siyaoran (七星) 2016-03-13 19:08:00

是逆转吧电脑胜率从79%掉还有职九们觉得李要输了

作者: aegis43210 (宇宙) 2016-03-13 19:08:00

有比挖更好的下法吗？这一步李世石想了十五分钟的说

作者: siyaoran (七星) 2016-03-13 19:09:00

依照古力和柯洁的下法明明就还差很多

作者: BusterPosey (Barca!Giants!Rafa!) 2016-03-13 19:09:00

版上有不世出的高手啊请赐教

作者: deacon (deacon) 2016-03-13 19:10:00

这手很明显连alphago也没算到不然后面不会崩溃那么明显

作者: NaoGaTsu (那欧卡兹) 2016-03-13 19:10:00

78手改下靠的话，结果真的难料...

作者: siyaoran (七星) 2016-03-13 19:16:00

AI不能快速从错误中学习的确还有一大段路要走

作者: DemonElf (LdsFish) 2016-03-13 19:29:00

Alphago之所以有别于以往的围棋AI就是他能学习成长好吗

作者: smallyuki (smallyuki) 2016-03-13 19:32:00

觉得要逼狗犯无可挽回的大错有两个条件第一是极佳的妙手，第二是这一手远超出狗的预期范围

作者: DemonElf (LdsFish) 2016-03-13 19:37:00

李能下出超出预期的这一手真的是很难得，别忘了Alphago已经自我对奕超过三千万盘棋

作者: Uizmp (黑袍法师) 2016-03-13 19:52:00

其实也有个吊诡的地方, 胜率接近八成代表还有两成可破说不定2成中就会有像今天这种一下子把胜率压到很低的走法

作者: danibaba5566 (BABA56) 2016-03-13 20:10:00

78手确实是手筋

作者: utap2001 (寻找一个漫长的答案 ) 2016-03-13 20:39:00

李也说78手是唯一一手所以他也知道他那时候胜率有2成而2成的胜率就要从这里突破他跟alphago想的都一样

作者: mothertime (我超爱傅红雪这变态) 2016-03-13 21:45:00

alphago好像不会记得这几盘棋

作者: fywei (应无所住而生其心) 2016-03-13 22:28:00

软件用的是大数据training 不会去特别对应某种情况

继续阅读

[心得] Alphago的弱点cscscscs22 [新闻] 李世石申请最终局执黑称这样获胜更有意义zkow [新闻] 黑嘉嘉赞李世石有勇气AAAC [情报] 详讯：围棋人机大战第四局李世石赢得首胜pf775 Fw: [问卦]世界围棋排名前127都是男人？屌打女棋手!KsSteven [问题] 关于读秒sck921 [棋讯] 叶罡廷7段人机大战第3.4盘实况预告mariakoutei [闲聊] 赛后访问小记queenghost [新闻] 阿尔法突然大抽疯谷歌:人类点中了它的BUGzkow Re: [爆卦] AlphaGo发现自己79步失误yamiyodare