Re: [讨论] 黑不贴目,初手天元,能下吗?

楼主: ddavid (谎言接线生)   2020-06-26 00:34:01
※ 引述《staristic (ANSI lover)》之铭言:
: 有个问题,板上如果有赛局理论的专家的话还请解答一下
: 1、“明显”有利和不有利的分界在哪?
: 我记得AlphaGo当初有公布内部的黑白胜率
: 在3.75子的贴点下白棋起始胜率是55%左右
: 开发团队的评论是“两方差不多,很公平”
: 代表有顶尖专家的Deepmind团队都认为至少到55:45这个比例仍是可接受的
: 印象中人类的对局黑白胜率统计并没有超过这个数字?
: (一时不知去哪找,有请各位高手补充)
: 是否有办法用数学的理由说明
: “现在的贴目对人类而言有没有差别”?
我分项来说:
1. 数学上的话,我们不妨这样思考:假设双方实力稳定而胜率固定,那么如果让一
方永远拿黑棋,另一方永远拿白棋,到底要下多少盘,期望值才会出现有实质意义的
胜负差距?
详细的推导我在这边不提,总之:
在固定胜率r下,进行n局棋的胜局期望值 = n * r
也就是说,0.55胜率下一局棋,期望值就是赢下0.55局。下两局,期望值就是赢
下1.1局。
那么什么叫做有实质意义的差距?这边就没办法有100%绝对精确的定义了,但是
我提出两个简易而直觉的参考标准:
● 如果下n局后,双方的期望值会差到1局以上,那表示就算双方实力相当也足以影
响胜负结果了吧?
● 如果下n局后,双方的期望值会差到0.5局以上,那似乎也表示胜率落后方要努力
发挥还多拿下一局才会更有机会胜出整个系列赛了吧?
那我们来看看七番棋,0.55 vs 0.45胜局期望值对比:
3.85 vs 3.15
差距是0.7局,直觉上已经是落后方需要付出更多一点努力的程度了,但好像又
没有不可挽救到差整整一盘。
显而易见0.5的门槛是落在五番棋上,而期望值直接多胜出一局则在十番棋大战
“几乎必然发生”了。也就是说在不交换黑白子持续下下去的情况下,这样下十番棋
在期望值上等于直接多让一盘出去。
然而只下一盘的话,就只差0.1,这个差距看起来就没有像是无法挽回的情况。
我们看看73开下七番棋的情况:
4.9 vs 2.1
这就非常明显了吧,光七番棋要直接多输2.8盘,几乎等于领先方直接听牌才来
跟你公平下的感觉。
2. 然而,如果看单一棋局的话,评估方式又有所不同了。这个评估更不容易,我以
下讲的是一个很直觉但并不精确的初步想法。如果能有大量对局的细部统计数据,其
实我们就有机会建立出更好的评估方式:
我们先做一点假设:假设平均一局棋会下100手(方便计算)。那么一方平均会
下50手。也就是说,双方轮流下一手,原本胜率落后方就必须把胜率追近:
(高胜率 - 低胜率) / 50
要能平均追近这么多,一百手以后才会成为一个均势结束。拿0.55跟0.45来看,
这是0.002。以人类下棋目前的胜率震荡,好像没有什么感觉嘛?
不对,我们要考虑到一件事情,就是下到结束时,胜率一定是变成1跟0。而假设
胜率计算精确且全局没有翻转,则可以想成是胜率领先一方的胜率慢慢成长到终局的
1。也就是胜率领先方其实先天可能拥有一个平均胜率自动增长量:
(1 - 高胜率) / 50
以0.55来说,他就得到一个0.009的平均来回一手之胜率自动增长。也就是说,
落后方其实要背负著0.002 + 0.009 = 0.011的胜率追赶速度。
每来回一手就必须要多追超过1%的胜率最后才真的会赢,是不是比较有感觉了一
些?
有人应该已经发现上面拆成两块来讲是在唬烂废话的,其实整合来说根本就是“
落后方到最后胜率要变1的平均胜率成长要求”:
(1 - 低胜率) / 50
我们看看73开的情况,是落后方每一手就要提升1.4%的胜率。如果实际常常用AI
验证自己棋局的棋友,应该会对这个要求的难度有更实际的体感。
然后我们就会发现,如果整局手数多,这个每来回一手平均胜率提升要求就会被
分摊得较少。这也可说符合棋理中落后方应该让盘面复杂,领先方应该让盘面简明的
概念,甚至落后方借由打劫来进一步增加总着手数也是一种手段。100手其实算很短
的估计,所以前述的范例其实都是高估难度的情况。
: 2、预期心理的影响有多大?
: 是否相较于现在的环境,会出现更多那种双方都觉得自己优势/劣势的对局?
: 不止是围棋,这类先天的乐观或悲观的心理是普遍的现象吗?
: 对于胜负的影响有多少?
这肯定有,另外包括时间运用也都包含在内。
但“有多少”我觉得非常难以评估,这方面比较偏棋手自己的风格与内心活动。
有人可能虽落后但差距不大就都只尽力下出想到的最佳着手稳定追逐,但有人可
能一落后就倾向下双方都不容易算清的强手打乱局势,导致的后续结果差距很大,所
以我不认为这部分可以有很公平的估计标准。
这方面可能可以做的研究是,个别分析不同棋手,去看特定棋手的胜率变化情况
,可以看出该棋手对于当下胜率是否敏感,以及发现自己胜率高或低时是否会明显出
现下法的变化等等。然后再整体统计所有棋手的情况,从而得出所有棋手有多少比例
会因为贴目数而下法明显出现不同的波动,进一步估计心态影响的强度及普遍性。
作者: Aipr (阿伯)   2020-06-26 00:47:00
人下的棋局 从来都不是胜率慢慢增涨到1的也许可用人类棋局过程的胜率,计算开局胜率与胜负的相关性
作者: staristic (ANSI lover)   2020-06-26 19:33:00
从番棋的角度看这个真是个有趣的观点XD

Links booklink

Contact Us: admin [ a t ] ucptt.com