Re: [好文推荐] 这两盘棋 没人会比李世石做得好

楼主: indium111 (#ttyhg)   2016-03-11 21:12:59
※ 引述《nnlisalive (nnlisalive)》之铭言:
: ※ 引述《raiderho (冷颜冷雨)》之铭言:
: : 依本文说法,AlphaGo的臭棋 (人类认定) 有三种可能性,而且都已经发生了:
: : 其一,在电脑判定的获胜机率已经非常高时,
: : 不同下法对机率的影响会钝化,可能只是99.9%与99.91%的差别而已,
: : 而算法设计可能会让非最佳解更容易被随机挑到。
: : 这种非最佳解,就是真正的臭棋 (逻辑上为严格劣势策略)。
: : 然而,若以上叙述为真,当电脑下出明显臭棋时,电脑应该已经大幅占优了。
: : 相反的,情势还在胶着时,下错会让获胜机率大幅降低,
: : 臭棋被挑中的机率近乎为零,这时,我们会看到非常紧绷的对局。
: : 这一点呼应“遇强则强,遇弱则弱”。
: : (最后一句不是指李和樊的差距,因为电脑棋力这几个月增加不少);
: 我觉得要从程式码方面下手了
: 首先就是阿发狗所谓的"胜率"是怎计算出来的?
: 不外乎用盘面上所得到的资讯转换成数据
: 再代入胜率函数得到每一点的胜率
: 那这个函数适用于任何盘面吗? 没有任何逻辑漏洞和盲点?
: 算出来的胜率没有误差? 如果有个点胜率是70%
: 具体来说应该是下了这个点跑到结束N次 有0.7*N次会赢
: 但明明就还没下完 也不知道对方会怎下
: 所以只要能骗过电脑 让他一直下到误判胜率的棋
: 阿发狗就会输到怎死的都不知道了
: 问题是要怎骗过阿法狗?
: 我 不 知 道 !
以前的围棋程式所用的蒙地卡罗算法
它的原理简单的说
就是在目前的棋盘上,下了某一子之后
随机开始落子,直到最后一子结束
最后判断是黑胜还是白胜
之后重复N次的随机落子,然后看这N次里面,黑胜几次,白胜几次
这样就可以判断下这一子的胜率为何
当然我们知道,黑白相互交错随机落子,变化总共有361!=10^768
就算是双方各下100步之后的情势,也还有161!=10^286
基本上都是超级天文数字,电脑不可能做全部的随机事件
所以电脑基本上只能做到有限的N次随机次数
基本上围棋盘面的真正变化次数跟电脑运算可随机的次数差距越小
获得的机率数值就越可能接近正确值
https://youtu.be/KMkjtZtGBsE
(网络有用蒙地卡罗法求π,看完大概就可以了解以上这段)
所以以前的围棋程式
在初期布局的时候常会下出让人类觉得很可笑的布局
越到后面变化越少时,则正确率越高
AlphaGO当然是超级进化版
它利用了类神经网络的学习,参考了人类棋谱
并自己跟自己对下累积了数千万盘棋
练出了所谓的"直觉",可以把一些荒谬的落子排除掉
(例如第一手八七这种荒谬的棋步)
大幅度减少了随机事件,使得算法推估胜率能更为准确
真正理论上的“围棋上帝”是使用穷举法的暴力演算
其运算变化是个天文数字,依照目前的电脑是办不到的
所以AlphaGo绝对不是“围棋上帝”
不过也不要因此小看了AlphaGo
简单的问题让大家想想吧
A=(10^768- 10^265)/(10^768)
A这个数字我们都知道不是100%,但它跟100%有什么不一样?
作者: birdy590 (Birdy)   2016-03-11 21:18:00
其实这后面的技术并不困难, 接下来几年不是不可能出现超车的...(会有多少人做这个毕业呢?)
作者: aaaba (小强)   2016-03-11 21:21:00
技术多困难不谈,消化数据没个像样的硬件会等死人
作者: birdy590 (Birdy)   2016-03-11 21:23:00
已经很多大公司在投资啦, 其实人事成本比硬件贵呢
作者: milkdragon (谢谢大家!!)   2016-03-11 21:24:00
1. 你略过了最重要的搜寻步骤(tree search); 2. 模拟棋局并非随机落子,若无围棋知识辅助,局势评估必定不准确
作者: birdy590 (Birdy)   2016-03-11 21:25:00
标准的 MCTS 是随机落子没错, 但是这样同样很没有效率在这里引进神经网络评估函数很高明, 太瞎的棋直接先跳过
作者: sck921 (The Fate)   2016-03-11 21:26:00
可是“直觉”有没有可能排除掉真正的好棋?
作者: birdy590 (Birdy)   2016-03-11 21:28:00
所以几个网络的训练很重要, 从这里也不难理解
作者: sck921 (The Fate)   2016-03-11 21:28:00
我把直觉假设成人类的棋感,那电脑会犯和人类一样的错吗?
作者: liaon98 (liaon98)   2016-03-11 21:29:00
单纯用蒙地卡罗法的话 之前的软件就这样 只能到业余4 5段
作者: milkdragon (谢谢大家!!)   2016-03-11 21:34:00
原po描述的只是“蒙地卡罗法”,只是MC,不是MCTS这跟AG用什么方法无关,因为你说的是“以前的程式”
作者: birdy590 (Birdy)   2016-03-11 21:36:00
其实后面的原理跟电脑棋类刚开始的时候一样没有变过当然还是要建决策树, MCTS 只是维护这棵树的方法而已在这之前只有 alpha-beta pruning, 这用在围棋上不能看在这之前电脑西洋棋/象棋也已经开始用 heuristic search来减少计算量, 所以现在连手机上棋力都可以强到不行
楼主: indium111 (#ttyhg)   2016-03-11 21:43:00
以后alphago的后代装进手机也不是什么问题
作者: birdy590 (Birdy)   2016-03-11 21:44:00
围棋的空间太大 想缩到这种程度恐怕有点困难 XD
楼主: indium111 (#ttyhg)   2016-03-11 21:44:00
到时候可能要禁止围棋选手外出上厕所和散步了
作者: lwei781 (nap til morning?)   2016-03-11 22:46:00
手机可以云端啊
作者: bearching (Pandora`s Box)   2016-03-11 23:16:00
云端运算应该可以办得到?
楼主: indium111 (#ttyhg)   2016-03-11 23:31:00
不要小看电脑硬件进步速度,你手中的iphone 6就比打败当年西洋棋王的深蓝电脑还快了

Links booklink

Contact Us: admin [ a t ] ucptt.com