Re: [问题] 再和alphago重复同一盘棋?

楼主: yamiyodare (shantotto)   2016-03-17 01:05:25
※ 引述《Dialysis (Chiquitia)》之铭言:
: 不好意思,有个问题想了好一会儿,实在是不确定答案,
: 想来也只有这个板最合适问。
: 倘若重复alphago第一盘和李世石的对奕内容,
: 那么,alphago还会下出一样的步数吗?
: 我的直觉告诉我,应该是不一样,
: 但,到底随机的机转及其比重占了多少,实在是不懂如何去思考,
: 请问有人能释疑?
围棋的一个盘面其实有八种变形, 对称 2 种乘上旋转 0/90/180/270 度 4 种.
完全相同的局面, 只是观棋的角度不同.
然而把这些盘面变形丢进 Policy/Value Network 得到的值不会完全相同.
把类神经网络设计成遇到变形可以吐出相同的值并不是办不到,
但会有一些副作用, 像是效果较差或是鉴别不出特殊的对称棋型.
一个解决的方法是把八种变形都丢进去算取平均, 棋力会更高一点但速度慢很多.
所以 AlphaGo 实战时是算到某个盘面时随机取一种变形,
再次算到时再取另一种变形平均, 一个盘面的估算最多是八种变形的平均.
如果这里的随机是真随机而非固定顺序,
那么同样的盘面还是会有微妙的差异影响后面的应手.
不过我个人认为... 实战用八倍的 GPU 下去解决比较快, 虽然很耗电 :p
作者: darkseer   2016-03-17 02:33:00
推,我的理解(可能不对)是AlphaGo使用的蒙特卡罗变形是没有随机性的(非常简化来说,如果有个盘面下A手的机率和B手的机率是2:1,那可能就会A-B-A-A-B-A...这样去搜寻说不定唯一的随机性就是原po提到的这点?
作者: birdy590 (Birdy)   2016-03-17 03:35:00
同一个点不保证每次算都一样
作者: shellpig (贝壳)   2016-03-17 13:18:00
有个问题耶...同样的盘面,因为方向不同,下起来会有差吗?程式来说把这八种变化视同为一种不难呀...o.Oa
作者: sck921 (The Fate)   2016-03-17 14:06:00
对喔还有旋转 XD
作者: BBSealion (海狮)   2016-03-17 17:28:00
其实也没这么多,开局黑棋第一手有不成文的习惯要下右这样就已经扣掉很多对称重复问题了要下右上角
作者: darkseer   2016-03-18 02:50:00
像原po解释的,paper有提到故意设计让它的判断标准对称可以做到但实战会变弱XD 其实我不懂为什么不过我觉得八倍的GPU还是不太值得? 至少多搜一层呢XD

Links booklink

Contact Us: admin [ a t ] ucptt.com