小弟17级,各位高段前辈勿鞭。
根据我对围棋粗浅的理解如下(如有错请多包涵)
贴目是因为黑棋先手的优势,因此必须给白子一定程度的补偿达到公平。
目前大多为贴 6.5或7.5目为主。(也就是白方目数+6.5或7.5赢黑子即算赢)
然而"事先"了解贴目也是很重要的事情,
因为为了取得不同级别的优势在对局中需采行的风险和报酬对应曲线也不一样。
例如如果黑贴2.5目,对白子来说就必须采行相对积极的态度。
但如果黑贴15.5目,则白子可较为保守,几乎比贴2.5目需要的地小了一大块。
因此要AlphaGo去自行对弈一千万场要求AlphaGo计算出最合逻辑的贴目是不太有意义的。
可是也许可以用反向逻辑从AlphaGo上取得资讯?
因为贴目数是离散的(0和自然数+0.5)
所以可以用贴目0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5等等一路测试
例如各打个200万场之类的?
然后去计算胜率期望值,找出最接近双方50%的那个贴目数,提供人类围棋界做参考。
前面好几篇推文讨论过利用AlphaGo编修围棋规则和胜利条件的可能性,
但是这个方法还没有人提过,供大家讨论。