感谢f大的发文,我也是长知识了
我得再次承认我对NN的理解太肤浅,这是我做得不好的
一方面是因为我是做RFIC的,我没那个能力时间把 NN 和 MCTS 的结合写得精确
(我就只是在一月ASP-DAC做了 turorial 的 chair 听了一整天NN,和看了那份 Nature
写这篇也参考了那个台大资工教授的文章)
另一方面是由于我所写的出发点是在,我希望借助我有的围棋知识和我比较熟知的 MCS
还有一些对于 AyaBot 的经验,去推估 AlphaGo(AG) 的可能弱点
而不是要告诉人 NN 如何在 AG 发挥作用,所以引出你这篇好文啊 XD
只是我不能同意 NN 是 AG 强的关键,
因为 NN 和 MCTS 是一起配合的,只有一方的情况下,过去的经验会告诉你它会弱很多
只有 NN 的话可以想像有可能发生,在第一局第7手下出未见过的布局,
AG 下一手就开始不会下,然后脆败
我知道 NN 是协助 MCTS 更有效率地找出最佳解 (类似 MC 跟 MCMC 的分别)
用围棋的话来说,NN 相当于一个形势判断 + 一个不强的算路 (相当于棋手第一感)
MCTS 就是在 NN 的协助下加强算路的能力,其实跟棋手的思维模式是很接近的
那么我将 NN 的助益完全算进 MCTS 的 sims 数提高,去估算 AG 的算路深度是合理的
第四盘我看完围棋TV张东岳的讲法,
我会说如果 78手 是胜著,那么 35手 虎 就是败著,没有虎而是黏,后面就不会有78了
也就是我上篇估计的三四十手算路
当然由于它有 MCTS 的关系,它在没改 code 的情况下,遇到同样的 78手,
它有可能会平安运转
我的看法是 Google 太小看李世石,如果1000台 server 增到2000台,说不定就够了
有人可能说 distributed 版跟单机版的胜率才77%,
但从十番棋的角度3胜1败已经接近把对方打降级了)
从两个现象看来,你不能抹杀 MCTS 的作用
1. 第二局的那个五路肩冲,那大概不是 NN 提供的优先选择吧,非得 MCTS 扫出来
当然五路肩冲在职业谱也不会没有,
我记忆中武宫有五五肩冲星位的棋吧,那更是对两边来说都是五路肩冲,
最近的棋也好像有吧,不过没有在布局的那么早段下
而是其他很多地方都定型后再肩冲五路的场合下法
但样本数少到单用 NN 是不可能建议你去下这种棋的,
但那个小机率权重让它能在 MCTS 中脱颖而出
2. 昨天败定后,AG 下出很多到无礼程度的业余下法,那也是 MCTS 的“功劳”
它相当于下出很俗的打将式绝对先手,然后期望对方气合脱先,从而得益
这在机率上就说得通了,但在下得很业余这个点上,它就变成丢下 NN 的 AI 了