Re: [微信文章] 中国李喆六段评第一战

楼主: tlchen (台湾加油)   2016-03-11 00:18:44
讲一下两日棋迷对于这所谓低阶失误的看法。
李喆讲出一些算法的正确观念,但有些地方他没考虑到。
※ 引述《tlm (Netherlands)》之铭言:
: 【四、AlphaGo 的“失误”】
: 这盘棋AlphaGo有没有失误?
: 令人欣慰,从人的眼光来看,我们可以找到AlphaGo的明显失误。这种失误不是指那种基
: 于人类经验而认为的失误(经验有可能会骗人),而是可以通过逻辑分析来确认的失误。
: 1 )“失误”一:
: 白136手吃。对于职业棋手而言很容易判断,应该吃在一路,比实战便宜大约1目。
: 2 )“失误”二:
: 白142手挡,对于职业棋手而言,这也是一个很容易确认的明显亏损。
: 白棋正确的下法是1位跳,这样将来留下了5、7、9吃两子救回三子的下法,从目数上分析
: 明显优于实战(大约1-2目)。即使白棋不在5位扳,走8位先手粘掉也优于实战一点点。
: 这两处“失误”都是在局部,没有任何与外界的关联性,属于封闭式的失误,其亏损可以
: 用逻辑推理的方式证明。相较于AI展示出来的水平,似乎这两个失误是“不应该”的。
: 基于此,又有棋手表示:“这都看不到,AI不过如此啊”。
: 前面“恶手”里讲到的左下角白棋的问题,也有人看做是第三个失误。但那个失误的性质
: 与这两个不同,我们对那个失误的认定在很大程度上还是基于经验的,虽然也包含了逻辑
: 推理,但并不完全。在我看来,按照笛卡尔的理论,对这那失误的认定是可怀疑的。
: 但这两个失误却不可怀疑。既然如此,我为什么要在标题里给“失误”打引号呢?
: 这引出了一个非常有趣的话题:在棋盘上,失误的定义是什么?
: 3 )不同的“失误”定义
: 对于我们棋手而言,什么是棋盘上的失误?假如我们把基于经验认定的失误都排除在外,
: 只留下基于逻辑推理认定的失误,那么失误意味着:A在逻辑上优于B,而我选择了B。
: 在这个意义上,只要我们找到了“可确认的更优下法”,就认为我们出现了失误。
: 但是,对于AI而言,失误是否意味着相同的事情?我们怎么理解AI出现了在我们看来低于
: 其水准的失误?
: 这就涉及到AI的算法问题。假如AI有一天穷尽了围棋,那么只要它有一步不踏在最优解集
: 合里,就是失误。但是,现在的AI还远无法穷尽围棋。
: AlphaGo的算法运用了神经网络加蒙地卡罗,蒙地卡罗算法的一个特点是:不求最优。
: 蒙地卡罗算法给出的是搜索之后的胜率评估,然后AI会根据这个胜率来选择落子点。也
: 就是说,AlphaGo本来就不追求最强最优的下法,它只是追求在它看来胜率最高的下法。
: 那么,回到前面那两个“失误”,之所以打上引号,是因为在AlphaGo看来,或许这根本
: 不是失误!
: 虽然在我们人类看来,逻辑上明显A优于B,但AI在那时认为两者的胜率相似,从获胜的角
: 度来说,两者没有区别!甚至A之后的犯错机率高于B,从而导致它认为B的胜率高于A!
: 如果两条路同样能通往胜利,在AI的意义上,你还能说它是失误吗?
: 或许能!
: 但是前提条件是人类利用这种“失误”击败了它!否则,在AI的意义上我们无法指责那是
: 它的失误。
蒙地卡罗算法并不是不求最优,只求胜率最高。精准一点的讲法是,它根本不知
 什么是最优,它是从它的有限模拟中,将胜率最高的,当做是最优的。
 因为这个原因,算法在大部份的情况下,它并不能确定它下的是不是最优的。那
 为什么会在好像困难的大局下出好棋,但在局部的地方,出现低阶失误?
 老实说,我认为根本完全不是失误。二日棋迷棋力不够,请有实力的人看一下我猜
 的对不对。在局末,优势确定下, AI 是可以选择,略微吃亏,但较有把握的方法
 。也就是说,可能到最后, AI 认为剩下的地方,这两处是它相对没有把握的,但
 这两处输个三目,它确定还领先,那它当然愿意选择这样做。人类是经过一些逻辑
 判断,确定这里怎么下最好。对 AI 来说,它的模拟可能也是跟它说,这样下最好
 。但它大概有另一个讯息,若照实际的下法,虽然吃亏,却有把握不输太多。相对
 的那些最优下法,它怕其实是自己没模拟到。
 所以,请厉害的棋手看一下,这两处是否是在收官时,相对复杂的地方?而 AI 下
 的地方,是不是后续变化相对单纯的地方?如果是的话,那 AI 根本没有失误,只
 是用另一种方式来确保胜利。如果局面落后, AI 依然下出这种非最佳解,我们才
 比较有把握说这是低阶失误。
作者: lwei781 (nap til morning?)   2016-03-11 00:25:00
所以会想要改贴目设定去逼AlphaGO看看
作者: NaoGaTsu (那欧卡兹)   2016-03-11 00:31:00
这解释蛮合理的。
作者: jimmy20642 (金殷2014拿冠军!)   2016-03-11 00:34:00
A有80%的可能赢20目,B有90%的可能赢1目,以程式来讲会跑B,但以人来看是一步缓手...小猜想
作者: broodworld (john)   2016-03-11 00:37:00
小局部MC不是等于穷解吗
作者: NaoGaTsu (那欧卡兹)   2016-03-11 00:37:00
同意jimmy20642的推论。小局部能穷解只是正好和胜率解同解?
作者: liaon98 (liaon98)   2016-03-11 00:38:00
收官其实不是重点啊 大家都知道电脑收官超强
作者: NaoGaTsu (那欧卡兹)   2016-03-11 00:38:00
大家都知道电脑收官超强,但弃子争先全压先手收官的想法就很意外了…
作者: broodworld (john)   2016-03-11 00:39:00
变化摆得完的话,两解应该收敛所以其实落后不多也应该下下看拼一拼?
作者: a1223356 (京)   2016-03-11 00:40:00
越后面电脑计算能力越省力,也会越好是正常的。
作者: broodworld (john)   2016-03-11 00:41:00
我觉得弃子争先职棋想得出来,前提要有时间
作者: NaoGaTsu (那欧卡兹)   2016-03-11 00:41:00
掌控时间也是棋力的一部分啊....
楼主: tlchen (台湾加油)   2016-03-11 00:42:00
jimmy20642 讲的情况,还要配合目前领先落后,棋局阶段,然后 AI 再根据哪个是通往最后胜利的最好机会若是落后个十目,或许就选 A 了然后,大家可能太小看所谓的局部能穷解首先,什么叫局部,对于有棋感的棋手,这当然不是问题但对于 AI 来说,多远算是局部,都没那么容易所以,局部的问题,是相对容易,但不见得 AI 能算完
作者: benjamin1169 (阿呆名)   2016-03-11 01:03:00
你太低估ai了 今天很明显计算是不同水平的
作者: Senkanseiki (戦舰栖姫)   2016-03-11 01:04:00
AI本来就不是把所有变化算完啊,他只是扫了一遍众多变化的胜率而已然后他下了胜率最高的那个变化棋谚第一句就说胜利不用胜的多了
作者: arnold3 (no)   2016-03-11 01:09:00
对电脑来说 第几手后就算收关了
作者: gj942l41l4 (米食主義者)   2016-03-11 01:13:00
说真的电脑的思考在跑局部最佳解,人类又何尝不是呢?搞不好是人类自己脑中没run到 而电脑看到输的可能
作者: mothertime (我超爱傅红雪这变态)   2016-03-11 01:16:00
围棋对电脑来说是减法,每走一步可能性就减少许多
作者: Senkanseiki (戦舰栖姫)   2016-03-11 01:18:00
那可能真的是人类无法理解的领域了,看那天Google如果有释出程式或再开放更多挑战,看AlphaGo跟职业棋士下能不能打出他看到的逆转,再翻转当前的围棋理论AG虽不能讲话,但还是可以下棋让更多人看见他的思路
作者: gj942l41l4 (米食主義者)   2016-03-11 01:25:00
把两台AlphaGO互打的情况拿出来看 或许就能发现什么
作者: Senkanseiki (戦舰栖姫)   2016-03-11 01:40:00
AG左右互搏可能有太多跟人类不同的理解,还是跟人类对弈比较好
作者: bxxl (bool)   2016-03-11 01:40:00
如果有程式码 就可以让他显示每一步的搜寻树跟评分
作者: birdy590 (Birdy)   2016-03-11 01:45:00
这要和开发团队合作才有可能 例如从某一手以后双方交换看看 AlphaGo 要怎么对付自己出的招如果人下不活的让电脑来下能活, 那棋力高低就没有疑问了
作者: frank61708 (Sensation)   2016-03-11 03:15:00
AlphaGo里面神经网络的训练目标的确是以胜负结果为主因此赢10目还是赢2目对它而言都是一样的它主要想确定的是 它赢棋的"机率"
作者: SansWord (是妳)   2016-03-11 09:52:00
alphaGo 释出程式码也锻炼不出现在的强度。除非 DeepMind 连train 好的参数都愿意公开我其实觉得他们可以公开给职棋玩看看和测试但会不会干扰现在的 trained result 就不一定了
作者: poverty (forever )   2016-03-11 22:09:00
推40楼。自我否定的否定 是真正的检验

Links booklink

Contact Us: admin [ a t ] ucptt.com