Re: [爆卦] AlphaGo发现自己79步失误 yamiyodare PTT批踢踢实业坊

Re: [爆卦] AlphaGo发现自己79步失误

楼主: yamiyodare (shantotto) 2016-03-13 18:13:52

※ 引述《darkseer ()》之铭言：
: Demis Hassabis推特：(Deepmind 创办人&CEO, 以下翻译差勿怪)
: https://twitter.com/demishassabis
: 两小时前: 李世石下得很好！AlphaGo本来认为自己下得很好，但在87手迷惑了。
: 我们现在有麻烦了...
: 一小时前: 错误发生在第79手，但AlphaGo到87手才意识到这点。
: (按: 自然地想跟78手有些关系，不过这里没有说明)
: 43分钟前: 我的‘认为’和‘意识’，我指的是AlphaGo的价值网络value net，
: 在79手时认为胜率是70%，但到87手就沉下去了。
: (按: 原文只说value net，不清楚是简称还是具体单指value network)
: 34分钟前: 李世石赢了!! 恭喜，他对我们很好的压迫AlphaGo让它犯出大错。
他的意思可能是 AlphaGo 对于 79~86 手之间的盘面
value network 还是评估自己胜算很高, 但在 87 手突然掉下去.
value network (形势判断) 训练出来的值有问题.
应该要更早几手吐出胜算低的值, 才能避免往这种变化下.
79 是不是败著不知道, 因为可能 78 一下黑棋就讨不了好,
那么败著还要再往前推几手.

作者: arcworld (人生究竟是什么呢？) 2016-03-13 18:15:00

是的，如果78是小李的逆转手，那问题肯定出现在更早之前

作者: ilw4e (可以吃吗？) 2016-03-13 18:17:00

败著应该是83，右边不要动直接处理中间应该胜负还未知

作者: BusterPosey (Barca!Giants!Rafa!) 2016-03-13 18:18:00

是不是小李大马步飞出来跑去右边肩冲那一棋?

作者: ilw4e (可以吃吗？) 2016-03-13 18:18:00

再往前推的话可能就69直接下71位就不会有这些后续了

作者: birdy590 (Birdy) 2016-03-13 18:19:00

这状况代表的通常是这招从来没看过评估的时候当然漏了

作者: gamania10000 (自助旅行中) 2016-03-13 18:20:00

电脑优势时会缩小棋盘减少变化.所以形势判断很重要

作者: NaoGaTsu (那欧卡兹) 2016-03-13 18:25:00

这篇的理解应该是正确的。形势判断部分的策略逻辑应该有问题。

作者: lolylolyosu (3-1次元) 2016-03-13 18:37:00

我觉得跟被吃子有关因为子一被吃盘面就改变了

作者: NaoGaTsu (那欧卡兹) 2016-03-13 18:39:00

跟被吃子应该无关，因为AG会重新估算盘面。

楼主: yamiyodare (shantotto) 2016-03-13 18:51:00

看起来胜率陡降是个很好的抓 debug 方式

作者: darkseer 2016-03-13 18:51:00

推，不过我对于value network是不是该称为形势判断有些疑义XD 毕竟形式判断是个围棋词语?

作者: fellwinter 2016-03-13 19:37:00

会惊呼的原因是 79手后黑选择打劫仍然是占优的局面但是黑选择放弃打劫却又下出一连串自损的下法直接导致局面翻转

继续阅读

[新闻] 王檄九段：电脑棋神变棋痴韩国棋手被惊呆qweewqq [历史] AlphaGo(黑) - 李世石(白) 第四局棋谱zelkova [心得] 出错与否ForeverOrz [问题] 如果第五战李世石..paraparapa Re: [新闻] 柯洁：李世石赢回尊严电脑挑战我不够格Rueyh [新闻] 我们直接问了AlphaGo：敢不敢和中国棋手比zkow [讨论] AlphaGo 的可能性弱点giorno78 [新闻] 李世石三连败于AI　港棋手：他未发挥水准zkow Re: [爆卦] AlphaGo发现自己79步失误darkseer [新闻] 李世石算出神之一手逼电脑出错扳回一城 zkow