※ 引述《nnlisalive (nnlisalive)》之铭言:
: 我觉得要从程式码方面下手了
: 首先就是阿发狗所谓的"胜率"是怎计算出来的?
: 不外乎用盘面上所得到的资讯转换成数据
: 再代入胜率函数得到每一点的胜率
: 那这个函数适用于任何盘面吗? 没有任何逻辑漏洞和盲点?
: 算出来的胜率没有误差? 如果有个点胜率是70%
: 具体来说应该是下了这个点跑到结束N次 有0.7*N次会赢
: 但明明就还没下完 也不知道对方会怎下
: 所以只要能骗过电脑 让他一直下到误判胜率的棋
: 阿发狗就会输到怎死的都不知道了
: 问题是要怎骗过阿法狗?
: 我 不 知 道 !
AlphaGO "胜率"计算大约是
最原始概念
假设现在盘面上AlphaGO有ABCDE五个地方值得下
就对ABCDE这个五位置后续各往后 快速随机乱下1000盘
一直下到官子结束看最后赢几盘
假设结果
A位置 赢830盘 输170盘
B位置 赢750盘 输250盘
C位置 赢640盘 输360盘
D位置 赢912盘 输 88盘
E位置 赢120盘 输880盘
电脑不会管平均赢了几目只看输赢 最后就会选位置D
==================================
当然围棋"随机乱下"一千盘参价值可能有限
接下来做的就是让
"随机乱下1000盘"变成"快速下出1000盘有参考价值的棋"
MCTS围棋的棋力就建构在
"随机乱下"阶段 有意义的落子选择还有快速下完那1000盘的棋局质量