※ 引述《nnlisalive (nnlisalive)》之铭言:
: ※ 引述《raiderho (冷颜冷雨)》之铭言:
: : 依本文说法,AlphaGo的臭棋 (人类认定) 有三种可能性,而且都已经发生了:
: : 其一,在电脑判定的获胜机率已经非常高时,
: : 不同下法对机率的影响会钝化,可能只是99.9%与99.91%的差别而已,
: : 而算法设计可能会让非最佳解更容易被随机挑到。
: : 这种非最佳解,就是真正的臭棋 (逻辑上为严格劣势策略)。
: : 然而,若以上叙述为真,当电脑下出明显臭棋时,电脑应该已经大幅占优了。
: : 相反的,情势还在胶着时,下错会让获胜机率大幅降低,
: : 臭棋被挑中的机率近乎为零,这时,我们会看到非常紧绷的对局。
: : 这一点呼应“遇强则强,遇弱则弱”。
: : (最后一句不是指李和樊的差距,因为电脑棋力这几个月增加不少);
: 我觉得要从程式码方面下手了
: 首先就是阿发狗所谓的"胜率"是怎计算出来的?
: 不外乎用盘面上所得到的资讯转换成数据
: 再代入胜率函数得到每一点的胜率
: 那这个函数适用于任何盘面吗? 没有任何逻辑漏洞和盲点?
: 算出来的胜率没有误差? 如果有个点胜率是70%
: 具体来说应该是下了这个点跑到结束N次 有0.7*N次会赢
: 但明明就还没下完 也不知道对方会怎下
: 所以只要能骗过电脑 让他一直下到误判胜率的棋
: 阿发狗就会输到怎死的都不知道了
: 问题是要怎骗过阿法狗?
: 我 不 知 道 !
以前的围棋程式所用的蒙地卡罗算法
它的原理简单的说
就是在目前的棋盘上,下了某一子之后
随机开始落子,直到最后一子结束
最后判断是黑胜还是白胜
之后重复N次的随机落子,然后看这N次里面,黑胜几次,白胜几次
这样就可以判断下这一子的胜率为何
当然我们知道,黑白相互交错随机落子,变化总共有361!=10^768
就算是双方各下100步之后的情势,也还有161!=10^286
基本上都是超级天文数字,电脑不可能做全部的随机事件
所以电脑基本上只能做到有限的N次随机次数
基本上围棋盘面的真正变化次数跟电脑运算可随机的次数差距越小
获得的机率数值就越可能接近正确值
https://youtu.be/KMkjtZtGBsE
(网络有用蒙地卡罗法求π,看完大概就可以了解以上这段)
所以以前的围棋程式
在初期布局的时候常会下出让人类觉得很可笑的布局
越到后面变化越少时,则正确率越高
AlphaGO当然是超级进化版
它利用了类神经网络的学习,参考了人类棋谱
并自己跟自己对下累积了数千万盘棋
练出了所谓的"直觉",可以把一些荒谬的落子排除掉
(例如第一手八七这种荒谬的棋步)
大幅度减少了随机事件,使得算法推估胜率能更为准确
真正理论上的“围棋上帝”是使用穷举法的暴力演算
其运算变化是个天文数字,依照目前的电脑是办不到的
所以AlphaGo绝对不是“围棋上帝”
不过也不要因此小看了AlphaGo
简单的问题让大家想想吧
A=(10^768- 10^265)/(10^768)
A这个数字我们都知道不是100%,但它跟100%有什么不一样?