※ 引述《HeterCompute (异质运算)》之铭言:
: https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games/
: AlphaGo说每天都会更新10盘新的自我对战。
: PS:一开始点进去第一盘好像会有bug不能按,
: 要看的话请自己点一下其它盘再点回来第一盘。
: PS2:10盘有8盘黑棋爆炸,看来贴目7.5太多了XD
看野狐职棋讲前三盘,大致就是一直说看不懂:D
如果说真要从AI学些什么,大概主要在布局阶段吧。模拟出来的结果
让人知道不同布局下哪边才是最大的大场。
用这角度思考很好理解为什么AI通常不会把人类定石下完,因为定石
的每步交换都是只看"区域"的两分而较少考虑全局,而每步价值可能
是递减的,比方说占空角可能价值20目,挂角可能值15目,再下一步
可能只剩10目,所以AI可能挂完就手拔了,因为外面有更大的点(AI
理解为胜率更高)
再来就是不同局面下先手价值多大或什么时候可以手拔也是可以跟AI
学习判断的。不管AI互下或跟人下的谱常常就是一直手拔,有时做些
区域被认为损目的交换就是为了抢先手。这次觉得柯洁很厉害的点就
是三盘似乎都不像上次李世石那么被动,他很努力在各种情势中设法
脱先,避免局势完全被电脑带着走,但可惜实力有差距
想想真要对人类学棋更有意义的话可能还是要人类和AI对弈。从AI逻
辑来想,他的胜负手或官子都和人类理解的最佳下法有差异,而且对
人下棋的逻辑来说是没什么帮助的。比方说收官吧,人类落后时仍会
下最佳解(最大官子)等待机会,但对AI来说他早就预见这样收必败,
胜率很低。所以AI互下时落后方AI的选点可能是人类一看明显没棋又
损目的送菜(对AI来说送菜的点可能他模拟时才有胜机),而领先方AI
可能判断大优势所以一直退让也一样在损目,这种时候两边都不是下
最佳解,那自然就不一定值得学
这次放出的AI对奕谱大概都是挑过的,猜测应该都是挑选全盘两方估
计胜率维持相近或是有胜率倒转的才较有可看性。不然很多AI对奕的
谱应该是一面倒,落后方不断用无理手测试然后越亏越多胜率不断被
拉开后投子