Re: [影片] 张东岳解说李世石获胜第四盘

楼主: mathbug (天堂的定义)   2016-03-14 08:56:56
※ 引述《nanlong (懒龙)》之铭言:
: ※ 引述《zkow (逍遥山水忆秋年)》之铭言:
: : 围棋世纪人机大战李世石 vs AlphaGo 第四盘
: : 张东岳点评:弥足珍贵的一场胜利【围棋TV】
: : https://www.youtube.com/watch?v=00HP4e8e_iQ
: : 解说详细,长达二十几分钟,可看看
: 看了影片及网络一些高手解说后
: 才知那手还真不是 围棋 所说的神之一手
: , 因为对手冷静下来想就有几种应法都可不吃亏继续领先
: 甚至直接让棋局告终。
: 不过实战结果却有让狗狗中风的奇效 算是另一类的 "神之一手" 哈。
: ps: 棋界的神之一手大概是说 让所有人在事前事 后
: 怎样想都无法抵抗的胜著妙手吧。
: 有时对手会惊讶到 "含笑九泉" ~~
有可能这是这一代AlphaGo系统伴随的不稳定性
请参考 我的文章 #1MvKziMw
这也是为什么AlphaGo所有的选择都倾向 简明 + 高胜率
这在系统工程上不是小问题
问题的解决有可能需要让AlphaGo加上一个稳定系数/函数
当盘面/系统的不稳定情况大增 计算方式或是记算量需要调整
作者: darkseer   2016-03-14 09:05:00
等等,你上一篇文章没有解释为什么会倾向简明+高胜率呀?
作者: Uizmp (黑袍法师)   2016-03-14 09:32:00
我个人是觉得 AG自身学习的结论, 对含有打劫的分支权重偏低有可能是样本不够多, 有可能是多重劫的分支很难有效展开因此都会采取避免打劫的的方式进行
作者: darkseer   2016-03-14 09:37:00
不过这样子会不会反而轻忽对手可以导入打劫的下子?纯粹讨论AI,如果AlphaGo自己觉得打劫很不好,那应该同时会轻忽李九段可以导入打劫的棋手,但看了职业讲解不像
作者: Uizmp (黑袍法师)   2016-03-14 09:39:00
很有可能,前三盘要不就是成功避开,要不就是打劫影响不够大
作者: darkseer   2016-03-14 09:41:00
因为我听讲解好像是说,李九段本来有机会打劫,但AG规避当然像你说的,只有三盘本来我这样想就很容易有盲点XD
作者: Uizmp (黑袍法师)   2016-03-14 09:44:00
不太懂你上面两段说的, 轻忽导入打劫的棋手 vs AG规避这两件事情不一样吗? 我的意思是AG对往打劫的分支权重较低
作者: darkseer   2016-03-14 09:45:00
噢sorry,我是说,单论他们paper内容,搜寻树对黑白对称所以如果觉得黑主动挑起劫争是坏棋,那反过来应该也会,也就是会乐意制造让对手有机会产生劫争的棋步,但前三盘转播的看法好像与此相反,认为AG会规避劫争
作者: Uizmp (黑袍法师)   2016-03-14 09:50:00
我猜是自我对弈的中,不管AG执黑或白,打劫分支都会降低胜率打劫分支的展开可能会比避劫多出很多,而且胜负难料,算不完
作者: darkseer   2016-03-14 09:57:00
黑白同时降低胜率这个我自己觉得是算法的基本错误XD
作者: Uizmp (黑袍法师)   2016-03-14 09:57:00
假设打劫双方都讨不了好,胜率50%,当时避劫AG评估将近80%
作者: Uizmp (黑袍法师)   2016-03-14 09:58:00
以50%举例, 就是说对黑方不利, 白方有利至于 97 那边我觉得是另外一个问题
作者: darkseer   2016-03-14 09:59:00
对不起97举例可能不太好,譬如说93 :p 只是类比
作者: Uizmp (黑袍法师)   2016-03-14 09:59:00
之前的棋局里面, 好像还没有逼到AG胜率低迷的情况 ?
作者: darkseer   2016-03-14 10:00:00
嗯嗯,我不反对你的结论XD对不起补充一下,你说的对,我主要就是因为这里是围棋板
作者: Uizmp (黑袍法师)   2016-03-14 10:07:00
搞不好AG还有一个"靠北,算不完,我不要打劫"的价值评估
作者: darkseer   2016-03-14 10:08:00
觉得应该强调‘算法的结论是AI可能在优势时避免劫争’说不定XD 也许围棋高手会得到这样的结论 :p但是从算法的观点没有理由特别相信这样..吧? :D
作者: aaaba (小强)   2016-03-14 10:12:00
看你ID,应该是懂点数学,请解释在NN这种高度非线性函数里,什么叫稳定系数。你要说得那么空泛,干脆推文就可以了
作者: doomhydra (认真活每一天)   2016-03-14 10:48:00
学点 deep learning 再来好吗? 一篇一篇打脸很累
作者: aaaba (小强)   2016-03-14 17:35:00
抱歉,我看不出alphaGo有回授

Links booklink

Contact Us: admin [ a t ] ucptt.com