※ 引述《darkseer ()》之铭言:
: Demis Hassabis推特:(Deepmind 创办人&CEO, 以下翻译差勿怪)
: https://twitter.com/demishassabis
: 两小时前: 李世石下得很好!AlphaGo本来认为自己下得很好,但在87手迷惑了。
: 我们现在有麻烦了...
: 一小时前: 错误发生在第79手,但AlphaGo到87手才意识到这点。
: (按: 自然地想跟78手有些关系,不过这里没有说明)
: 43分钟前: 我的‘认为’和‘意识’,我指的是AlphaGo的价值网络value net,
: 在79手时认为胜率是70%,但到87手就沉下去了。
: (按: 原文只说value net,不清楚是简称还是具体单指value network)
: 34分钟前: 李世石赢了!! 恭喜,他对我们很好的压迫AlphaGo让它犯出大错。
他的意思可能是 AlphaGo 对于 79~86 手之间的盘面
value network 还是评估自己胜算很高, 但在 87 手突然掉下去.
value network (形势判断) 训练出来的值有问题.
应该要更早几手吐出胜算低的值, 才能避免往这种变化下.
79 是不是败著不知道, 因为可能 78 一下黑棋就讨不了好,
那么败著还要再往前推几手.