※ 引述《tsppajrdrrfs ()》之铭言:
: ※ [本文转录自 Gossiping 看板 #1MvIov-I ]
: 作者: n91324 (不丹) 看板: Gossiping
: 标题: [爆卦] AlphaGo发现自己79步失误
: 时间: Sun Mar 13 17:02:45 2016
: Deep Mind 创办人在推特表示
: Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
: 所以AG确实在79有失误
: 而且她下到87才发现自己之前的失误
: 补上推特:
: 推 OrzJ: https://twitter.com/demishassabis 推特
从这两个 twitter 来看, AI 在 79 时仍认为自己有 79% 的胜率,
直到第 87 手时,才发现胜率骤降。四日棋迷猜测如下:
AI 估计胜率是经由之后的模拟,白 78 手被认为神手,但或许是之后
的巧妙变化是不明显的,所以 AI 无法知道这手有这么大的功用,或
是说,无法准确的评估此时的盘面。
要知道,AI 的估算是根据之后的模拟,它并没有人类逻辑式的推演,
所以它不见得能得到之后的最佳变化。某种意思下,它是取模拟的加权
平均,但只要之后最佳的应对没被模拟到,它的评估自然不准。又或者
是,最佳应对跟其它应对方的结果差很多,若不能给最佳应对接近 1
的权重,那它的评估就失准。
而随着棋局变化,又多下了几手,能变化的地方变少,AI 自然比较能
模拟到正确的应对,才惊觉自己已经落后。
这提供了要对付目前这版 AlphaGo 的方法,你最好下一些方法是:接
下来对你的最佳解跟次佳解,结果会差很多,这样 AI 用模拟的,就有
机会误判。如果你下的棋,接下来的应对,结果都差不了太多,那 AI
自然估得准。让它估不准,才会在接下来还没估准前,继续出错。