Re: [爆卦] AlphaGo发现自己79步失误

楼主: yamiyodare (shantotto)   2016-03-13 18:13:52
※ 引述《darkseer ()》之铭言:
: Demis Hassabis推特:(Deepmind 创办人&CEO, 以下翻译差勿怪)
: https://twitter.com/demishassabis
: 两小时前: 李世石下得很好!AlphaGo本来认为自己下得很好,但在87手迷惑了。
: 我们现在有麻烦了...
: 一小时前: 错误发生在第79手,但AlphaGo到87手才意识到这点。
: (按: 自然地想跟78手有些关系,不过这里没有说明)
: 43分钟前: 我的‘认为’和‘意识’,我指的是AlphaGo的价值网络value net,
: 在79手时认为胜率是70%,但到87手就沉下去了。
: (按: 原文只说value net,不清楚是简称还是具体单指value network)
: 34分钟前: 李世石赢了!! 恭喜,他对我们很好的压迫AlphaGo让它犯出大错。
他的意思可能是 AlphaGo 对于 79~86 手之间的盘面
value network 还是评估自己胜算很高, 但在 87 手突然掉下去.
value network (形势判断) 训练出来的值有问题.
应该要更早几手吐出胜算低的值, 才能避免往这种变化下.
79 是不是败著不知道, 因为可能 78 一下黑棋就讨不了好,
那么败著还要再往前推几手.
作者: arcworld (人生究竟是什么呢?)   2016-03-13 18:15:00
是的,如果78是小李的逆转手,那问题肯定出现在更早之前
作者: ilw4e (可以吃吗?)   2016-03-13 18:17:00
败著应该是83,右边不要动直接处理中间应该胜负还未知
作者: BusterPosey (Barca!Giants!Rafa!)   2016-03-13 18:18:00
是不是小李大马步飞出来 跑去右边肩冲那一棋?
作者: ilw4e (可以吃吗?)   2016-03-13 18:18:00
再往前推的话可能就69直接下71位就不会有这些后续了
作者: birdy590 (Birdy)   2016-03-13 18:19:00
这状况代表的通常是这招从来没看过 评估的时候当然漏了
作者: gamania10000 (自助旅行中)   2016-03-13 18:20:00
电脑优势时会缩小棋盘减少变化.所以形势判断很重要
作者: NaoGaTsu (那欧卡兹)   2016-03-13 18:25:00
这篇的理解应该是正确的。形势判断部分的策略逻辑应该有问题。
作者: lolylolyosu (3-1次元)   2016-03-13 18:37:00
我觉得跟被吃子有关 因为子一被吃盘面就改变了
作者: NaoGaTsu (那欧卡兹)   2016-03-13 18:39:00
跟被吃子应该无关,因为AG会重新估算盘面。
楼主: yamiyodare (shantotto)   2016-03-13 18:51:00
看起来胜率陡降是个很好的抓 debug 方式
作者: darkseer   2016-03-13 18:51:00
推,不过我对于value network是不是该称为形势判断有些疑义XD 毕竟形式判断是个围棋词语?
作者: fellwinter   2016-03-13 19:37:00
会惊呼的原因是 79手后黑选择打劫仍然是占优的局面但是黑选择放弃打劫 却又下出一连串自损的下法直接导致局面翻转

Links booklink

Contact Us: admin [ a t ] ucptt.com