其实写得很好!
只是有些许地方我觉得有些疑问
: 会下出黑101的理由同上 电脑算不出分数更高的棋会倾向“维持现状”...
: 奇怪了我怎么突然觉得我的用词有政治意味............XDDDDDDDDD
alphago会不会倾向于维持现状,我不是非常了解。
主要疑惑点在于官子
http://i.imgur.com/siQwKgm.png
这是alphago在nature中提供的运算原理简图。
图下有详细说明。
大致上是说:
(a)系统会先选点,
予以最高行动值(action value)"Q"+u x 预先机率(Prior probability)"P"
找出最大者
(b)扩张
找分枝。
(c)演化后
(d)回车
至初始点,修正机率。
换而言之,因为行动值的参与,所以与目数或点数相关。
因为有循环协助,机率不会完全参照当下情形,更重于未来发展。
: 最后来解释一下末段AlphaGO官子崩坏的问题...
: 这个可能是AlphaGO以机率进行计算所产生的独特问题
: 非常值得重视和研究!
: 因为对于人类而言 下到官子阶段所判断的单位是“子”或者是“目”
: 这和比赛胜负的计算单位是相同的 是一个绝对的值
: 比如同样后手官子一个5目一个3目 那当然是5目的大 这是绝对的
: 可是 如果转换成“胜率”概念 那就不一样了!
: “胜率”本质上是一个会随着棋盘上子数变动的东西......
: 当棋盘上的子数越来越多 代表棋局越进入尾声 胜率会越确定
: 反之棋局越早期 胜率会越变动...
: AlphaGO用胜率为单位做计算所面临的问题是:
: 它没有办法真正有效区辨官子的大小
: 因为当它优势的时候:赢5目也是赢 赢3目也是赢
: 劣势 输5目也是输 输3目也是输
所以这个说法有些不太合理。
第一局的后半期白棋已非常优势。而白棋也未放松。
http://i.imgur.com/4lV2dLt.png
倘若电脑白棋不知官子,为何下此处而不补左下角?
http://i.imgur.com/LHcxAqb.png
第三局,若电脑白棋不知官子,又如何知道96求先手后98档?108点入后做活?
倘若原po说的没错,李世石下到后面岂不是都能半目负?
个人觉得不应该因为第四盘而小看电脑官子。
一般,根据过去电脑围棋的经验,官子一定是电脑最为擅长的。
毕竟排出先后手、比大小、分析死活后,一个算法就能轻松排出最佳解。
这也是人脑官子的逻辑。
虽然alphago的算法与过去不同,没有详细编码能参考,
但也明显未舍弃地域的参数。至于优劣就不清楚了。
: 这就是说用胜率计算的话
: 一个后手5目官子和一个后手3目官子对AlphaGO而言很可能都一样!
: 因为改变不了比赛结局!
: 这样一来在优势的时候它很可能下松 不过还可以维持在安全运转的范围之内
: 因为它总是会选择胜率大于50%的棋步......
: 但劣势的情况下则可能变成像是完全随机乱走!
: 因为官子不分大小看起来都是输!通通都一样!
: 这样的话根本没有办法在劣势情境下走出有效的抗衡手段 是非常严重的缺点!
: 我认为这个BUG的严重性可能会导致AlphaGO完全重写
: 下一代的BetaGO(?)应该会重回以“子”或“目”作为基本计算单位的架构
: 然后再慢慢去养......
: 话说这个基本单位问题的取舍是很重大的议题
: 研究团队应该有针对这个东西开发了几个前期版本加以实验才对...
: 我猜想以胜率为基本单位的优点
: 应该是在棋局前期根本无法换算出确定地的情况下 用胜率去判断会比较灵敏?
: 无论如何这造就了一代布局直觉狂胜人类的AlphaGO
: 衷心赞叹Deepmind团队对于棋艺的卓越贡献!希望能继续进步!
至于电脑的特点,相信各位经过几天观察也很清楚了。
电脑算机率,算可能性,毕竟是找出最适合夏法的直线型思考。
所以棋风硬直,轻巧处里的不多。
对于打入的演算十分敏感
第一局的18,78, 102
第三局108
第四局的113
腾挪算是前中期极强的
第三局尤为出色
之所以称为硬直是我的感觉,因为除了第三局的32算是极具轻灵色彩的好棋,其余多数
,除了极爱尖冲外,都为硬碰硬的棋风。非常具有现代特色。
可偏偏许多鬼手妙手并不在机率之中。
https://www.youtube.com/watch?v=4JswWVN2NcQ
就看第五名(第一局)
这种一路死活相关的妙手在演算中就不可能出现。一没地、二没气,正常算法都没优势。
更别说以前也没什么人下过,局势也十分新颖。
电脑下的出才怪。
第四局的李世石妙手就是明证。
围棋中也有很多时候,是十手、十几手后有某个妙手,因此当下着法是恶手。
因此,围绕着妙手恶手的设局,恐怕才是下赢电脑的关键。
有趣点在于,google究竟有没有让电脑参考古谱呢?