Re: [好文推荐] 这两盘棋 没人会比李世石做得好

楼主: saltfish (笨鱼)   2016-03-12 09:35:20
※ 引述《nnlisalive (nnlisalive)》之铭言:
: 我觉得要从程式码方面下手了
: 首先就是阿发狗所谓的"胜率"是怎计算出来的?
: 不外乎用盘面上所得到的资讯转换成数据
: 再代入胜率函数得到每一点的胜率
: 那这个函数适用于任何盘面吗? 没有任何逻辑漏洞和盲点?
: 算出来的胜率没有误差? 如果有个点胜率是70%
: 具体来说应该是下了这个点跑到结束N次 有0.7*N次会赢
: 但明明就还没下完 也不知道对方会怎下
: 所以只要能骗过电脑 让他一直下到误判胜率的棋
: 阿发狗就会输到怎死的都不知道了
: 问题是要怎骗过阿法狗?
: 我 不 知 道 !
AlphaGO "胜率"计算大约是
最原始概念
假设现在盘面上AlphaGO有ABCDE五个地方值得下
就对ABCDE这个五位置后续各往后 快速随机乱下1000盘
一直下到官子结束看最后赢几盘
假设结果
A位置 赢830盘 输170盘
B位置 赢750盘 输250盘
C位置 赢640盘 输360盘
D位置 赢912盘 输 88盘
E位置 赢120盘 输880盘
电脑不会管平均赢了几目只看输赢 最后就会选位置D
==================================
当然围棋"随机乱下"一千盘参价值可能有限
接下来做的就是让
"随机乱下1000盘"变成"快速下出1000盘有参考价值的棋"
MCTS围棋的棋力就建构在
"随机乱下"阶段 有意义的落子选择还有快速下完那1000盘的棋局质量
作者: nnlisalive (nnlisalive)   2016-03-12 09:54:00
原来如此 要有价值就是慢 而且够多盘的机率越准这样看来电脑还是在用穷举法逼近围棋之神只是这次的穷举法比较聪明 加进了机率与统计围棋就是变化复杂的特性 正好让用机率来计算落子的AlphaGo变得超级强
作者: fermib (ohyah)   2016-03-12 09:58:00
这种"穷举"已经很像人了 是一种经验累积 只是比较无脑的经
作者: clark78118 (clark)   2016-03-12 10:01:00
这篇错的 value network is used to reducethe depth of the search treeAlphaGo透过输入的棋谱跟自我对战 学习两件事1.哪里可能值得下 2.形势判断
作者: NaoGaTsu (那欧卡兹)   2016-03-12 10:12:00
简略化的概念的确如本篇所说AG强的地方在于,他有能力能判断“哪些位置需要去测胜率
作者: clark78118 (clark)   2016-03-12 10:12:00
他没有把棋下到end game 而是用形势判断
作者: NaoGaTsu (那欧卡兹)   2016-03-12 10:13:00
”这件事,因此需要消耗大量资源与时间的全盘式随机落子以及算完所有分支树的状况在AG的考量下不会发生。
作者: darkseer   2016-03-12 10:20:00
To clark78118: The second rollout phase of eachsimulation begins at leaf node sL and continuesuntil the end of the game. 他有算完啦XD只是它不只快速算完,也用了你说的形势判断我之前po文的时候自己也没看懂...刚才才去改@@原po说这是原始概念也对,paper分析说这部分影响最大我觉得深度学习带来的新能力是: 可以在极短时间不计算而做出业余初段等级的直觉判断。想像如果人类可以用0.01秒做到业余初段等级的判断,那加上计算就不得了了。
作者: fgkor123 (n(N))   2016-03-12 10:48:00
有讲到是三段等级的https://www.zhihu.com/people/tian-yuan-dong连结,搜 Table 7,刚好看到跑胜率图
作者: darkseer   2016-03-12 11:01:00
感谢,我说业余初段完全是个随意估计,抱歉@@不过我觉得DarkForest在这点还是很难超出职业棋评?
作者: fgkor123 (n(N))   2016-03-12 11:08:00
刚对了一下第二盘步数,6446开时,讲评也是众说纷纭

Links booklink

Contact Us: admin [ a t ] ucptt.com