讲一下两日棋迷对于这所谓低阶失误的看法。
李喆讲出一些算法的正确观念,但有些地方他没考虑到。
※ 引述《tlm (Netherlands)》之铭言:
: 【四、AlphaGo 的“失误”】
: 这盘棋AlphaGo有没有失误?
: 令人欣慰,从人的眼光来看,我们可以找到AlphaGo的明显失误。这种失误不是指那种基
: 于人类经验而认为的失误(经验有可能会骗人),而是可以通过逻辑分析来确认的失误。
: 1 )“失误”一:
: 白136手吃。对于职业棋手而言很容易判断,应该吃在一路,比实战便宜大约1目。
: 2 )“失误”二:
: 白142手挡,对于职业棋手而言,这也是一个很容易确认的明显亏损。
: 白棋正确的下法是1位跳,这样将来留下了5、7、9吃两子救回三子的下法,从目数上分析
: 明显优于实战(大约1-2目)。即使白棋不在5位扳,走8位先手粘掉也优于实战一点点。
: 这两处“失误”都是在局部,没有任何与外界的关联性,属于封闭式的失误,其亏损可以
: 用逻辑推理的方式证明。相较于AI展示出来的水平,似乎这两个失误是“不应该”的。
: 基于此,又有棋手表示:“这都看不到,AI不过如此啊”。
: 前面“恶手”里讲到的左下角白棋的问题,也有人看做是第三个失误。但那个失误的性质
: 与这两个不同,我们对那个失误的认定在很大程度上还是基于经验的,虽然也包含了逻辑
: 推理,但并不完全。在我看来,按照笛卡尔的理论,对这那失误的认定是可怀疑的。
: 但这两个失误却不可怀疑。既然如此,我为什么要在标题里给“失误”打引号呢?
: 这引出了一个非常有趣的话题:在棋盘上,失误的定义是什么?
: 3 )不同的“失误”定义
: 对于我们棋手而言,什么是棋盘上的失误?假如我们把基于经验认定的失误都排除在外,
: 只留下基于逻辑推理认定的失误,那么失误意味着:A在逻辑上优于B,而我选择了B。
: 在这个意义上,只要我们找到了“可确认的更优下法”,就认为我们出现了失误。
: 但是,对于AI而言,失误是否意味着相同的事情?我们怎么理解AI出现了在我们看来低于
: 其水准的失误?
: 这就涉及到AI的算法问题。假如AI有一天穷尽了围棋,那么只要它有一步不踏在最优解集
: 合里,就是失误。但是,现在的AI还远无法穷尽围棋。
: AlphaGo的算法运用了神经网络加蒙地卡罗,蒙地卡罗算法的一个特点是:不求最优。
: 蒙地卡罗算法给出的是搜索之后的胜率评估,然后AI会根据这个胜率来选择落子点。也
: 就是说,AlphaGo本来就不追求最强最优的下法,它只是追求在它看来胜率最高的下法。
: 那么,回到前面那两个“失误”,之所以打上引号,是因为在AlphaGo看来,或许这根本
: 不是失误!
: 虽然在我们人类看来,逻辑上明显A优于B,但AI在那时认为两者的胜率相似,从获胜的角
: 度来说,两者没有区别!甚至A之后的犯错机率高于B,从而导致它认为B的胜率高于A!
: 如果两条路同样能通往胜利,在AI的意义上,你还能说它是失误吗?
: 或许能!
: 但是前提条件是人类利用这种“失误”击败了它!否则,在AI的意义上我们无法指责那是
: 它的失误。
蒙地卡罗算法并不是不求最优,只求胜率最高。精准一点的讲法是,它根本不知
什么是最优,它是从它的有限模拟中,将胜率最高的,当做是最优的。
因为这个原因,算法在大部份的情况下,它并不能确定它下的是不是最优的。那
为什么会在好像困难的大局下出好棋,但在局部的地方,出现低阶失误?
老实说,我认为根本完全不是失误。二日棋迷棋力不够,请有实力的人看一下我猜
的对不对。在局末,优势确定下, AI 是可以选择,略微吃亏,但较有把握的方法
。也就是说,可能到最后, AI 认为剩下的地方,这两处是它相对没有把握的,但
这两处输个三目,它确定还领先,那它当然愿意选择这样做。人类是经过一些逻辑
判断,确定这里怎么下最好。对 AI 来说,它的模拟可能也是跟它说,这样下最好
。但它大概有另一个讯息,若照实际的下法,虽然吃亏,却有把握不输太多。相对
的那些最优下法,它怕其实是自己没模拟到。
所以,请厉害的棋手看一下,这两处是否是在收官时,相对复杂的地方?而 AI 下
的地方,是不是后续变化相对单纯的地方?如果是的话,那 AI 根本没有失误,只
是用另一种方式来确保胜利。如果局面落后, AI 依然下出这种非最佳解,我们才
比较有把握说这是低阶失误。