原PO底下推文不够精辟 耻于同流另回一篇
※ 引述《solomn (九米)》之铭言:
: 看了讨论文
: 说AI只考虑胜率
: 那么为什么赢少目的胜率会高于赢多目的胜率?
: 棋理是如何解释
: 谢谢
这跟“棋理”没有关系 是AG的运算模式所造成
简单讲就是剪枝对胜率影响的效果在某些时候会大过目数对胜率的影响效果
比如说今天要收官了 盘面大概AG赢20目
假设这时候有两个选点:
A点:先手5目,可是后续一套比较复杂
B点:后手-5目,而且盘面上明显在送,但可以减少10M个节点的计算量
由于AG“只管赢棋不管赢多少”的目标设定
经过胜率计算后很可能反而去选B点这种莫名其妙送菜的点
因为反正它现在还赢20目
它不需要去冒这10M个节点的计算风险 搞不好其中有杀龙翻盘手段
请注意...哪怕狗狗的TPU算度再强
程序本身所使用的蒙地卡罗法并没有人类所谓“局部算清”的这种概念
它永远面对的是仍有无数可能著点的全域...
在没有办法穷举的情况下
大量减少分枝但是还可以赢的著点 虽然表面上在送
对电脑来讲反而是最没有风险的著点
这种为了减少计算量进行退让的事情其实人类职棋也是常常在干...
你看那读秒阶段 胜势一方真的有办法处处局部算清官子滴水不漏????
哪有可能~~~~~~~~
几乎多少都会送一点 换取棋形的稳定
............只是说职棋送著送著送到被翻盘屡见不鲜
AG貌似送了一堆而且送的很荒谬但还是很稳
最后回到所谓“棋理”的部分...
所谓“棋理”我个人定义为穷举后的最佳手法
在开局阶段无论电脑或人类都不可能进行穷举......
所以即使是AG也只能说是近于道 无法真正描述什么是道
可是官子阶段就不同了...
不只是职棋有办法凭借强大的局部计算能力算清
旧式的以暴力计算为基础的围棋软件更是滴水不漏
我觉得AG应该设定成:
比如说它觉得胜利(或认输)的标准是70%(或30%)
那接下来的游戏进程就交给另一套以暴力计算为基础的软件来进行目数极大化的工作
以免后续的官子根本不能看XD
如果觉得这样不保险
甚至可以尝试写一套判断何时应该切换模式的学习程序让AI学习...
只要抓住了转换模式的时机
以AG强大的硬件配备跑暴力计算软件 在后盘血虐职棋根本不是梦!
有梦最美...让我们期待见证“棋理”的那一天!
哈哈哈哈~~~~~~~~