[将棋] 第27回世界电脑将棋大赛

楼主: ssccg (23)   2017-05-04 21:53:30
http://www2.computer-shogi.org/wcsc27/
二次预选 决胜
elmo 8-1 7-0
Ponanza Chainer 8-1 6-1 (输elmo)
技巧 6-3 4-3 (输elmo、ponanza、読み太)
大合神クジラちゃん 6-3 4-3 (输elmo、ponanza、技巧)
苍天幻想ナイツ・オブ・タヌキ 5-4 3-4
読み太 6-3 2-5
HoneyWaffle 6-3 2-5
NineDayFever 5-3-1 0-7
=== 晋级决胜 ===
大将军 5-4
Qhapaq 5-4
nozomi 5-4
Apery 5-4
这次Ponanza导入了deep learning、1092 CPU + 128 GPU的Cluster
号称对去年电王战版的Ponanza胜率超过80%
原本想说可能没什么好看的...
结果又有让Ponanza拿到败场的软件出现
elmo是最近出现在floodgate上、rating超过4000的monkeymagic
参赛使用的硬件只用2 CPU的主机
预定赛后也会公开,又有新玩具可以用了
作者: merhi0506 (白目光)   2017-05-04 23:25:00
电脑赛为什么会 连下两手 理解不能
楼主: ssccg (23)   2017-05-05 00:36:00
在轮到对方下的时候,传送不合法的指令到server,被判定为违规,其实不是真的送了下一手指令,只是规则上算二手指しelmo要2连胜ponanza了不知道是将棋跟DNN的相性问题,还是只是学习时间还不够
作者: NeedGem (本当傻蛋的宿命)   2017-05-05 16:53:00
觉得围棋只要机率过就好比较适合 DNN...将棋需要严格的将死才算数不太好用 DNN # 除非入玉.赛后... 只有棋谱和评价参数, 程式: Y王!!!!!
楼主: ssccg (23)   2017-05-05 17:02:00
やねうら王根本场外参战了,在比赛中推出新版本
作者: NewYAWARA (朝霞之前奏)   2017-05-05 17:27:00
有点横空出世的味道…而且是免费的,看来千田可以好好利用一下了elmo: https://goo.gl/HEhL6M
作者: NeedGem (本当傻蛋的宿命)   2017-05-05 17:40:00
他不负责写 engine, 他的努力都在棋谱和评价参数上了.
作者: NewYAWARA (朝霞之前奏)   2017-05-05 17:40:00
看了一下决赛,双方用的是主流的换角48金37桂29飞,后来elmo争取到入玉过程中大幅棋得,最后直接打趴pona
作者: NeedGem (本当傻蛋的宿命)   2017-05-05 17:42:00
https://pbs.twimg.com/media/C_DEIZmUwAErQ44.jpg从这边到可以赢... 嗯相较于大合神集众人之力还是被那两个玩假的... 囧也许是因为去年Y王本尊有赢到Pona才会有人想这种可能 @@Y王本人觉得这个比赛没钱赚所以不会自己下去拼吧 (X)应该说将棋不太适合直接把 DNN 丢上去用...
楼主: ssccg (23)   2017-05-05 19:18:00
クジラ好像用去年电王版本的Apery(这次参赛的Apery也是)众人之力的效果还是看的出来啦...明年要拿到优胜可能至少要比クジラ+elmo强,可能要R4500+?elmo看说明是从Apery开始加上各家的学习方法,主要改善终盘的强度,从上面那局面可以守住ponanza的进攻可以看出这方面可能是目前最强的吧
作者: NeedGem (本当傻蛋的宿命)   2017-05-06 10:00:00
试验一下炎之七番胜负第七局终盘, 用elmo评价参数之后...真的很快就在某一手看到... 28 手诘 (羽生已完蛋)Engine 终盘初测: Apery >= Y王 > silent_majority(魔女)初步乱来的终盘检证: http://0rz.tw/lebXG (放巴哈...)
楼主: ssccg (23)   2017-05-07 01:42:00
差不多各家都公开了(差技巧),各家的特色好像是qhapaq序盘强,読み太是单机强化版的Y牌引擎(可是我试觉得没Y4.41+强)pona跟alphago比了一下,DNN好像只有policy network,只用在决定各分枝探索的顺序上,剩下的就是cluster化,评价值好像都没提到,说不定就是都没有动...评价准确度输人的话找的快也没用,2~4名都是NPS几亿的cluster但是输千万级的elmoalphago在评价用了rollout和value network,value network在攻王类的好像CP值不好,rollout在将棋这种不知道什么时候结束的不知道效果如何...不过方法上应该还是有尝试的空间pona的policy准确率55%跟alphago的57%已经差不多了,再来重点还是要放在改善评价方法,至于引擎跟ML比较没关系,比较看写程式的人最佳化的功力了
作者: NeedGem (本当傻蛋的宿命)   2017-05-07 06:19:00
deep learning 的正确用途目前可能是拿来练评价参数.但是现行的二三驹关系不排除可能也有所侷限 (思)攻王需要的是正确的手顺, 用 value network 有其困难点.除了 kk/kpp/kkp 那套之外该有新的评价想法了
楼主: ssccg (23)   2017-05-07 06:39:00
新想法就技巧啊,只是这次没练赢...现在学习用的局面是用传统评价自我对战生的,加上policynetwork也许能用比较少的时间生出这些资料?
作者: NeedGem (本当傻蛋的宿命)   2017-05-07 07:01:00
刚刚把 usapyon2 dash 丢进 elmo 的 kk/kpp/kkp...当机了wwwwww
楼主: ssccg (23)   2017-05-08 02:10:00
技巧2出了,可以调强度和战型,这可以卖了吧...
作者: NeedGem (本当傻蛋的宿命)   2017-05-10 16:13:00
偷偷试一下检讨棋... 结果三种软件套elmo检讨出来不一样(著名实况台: 魔女 # 这边根据之前测试使用 Apery/Y王)太难了先摆一边... 囧
作者: lwei781 (nap til morning?)   2017-12-07 01:46:00
有新的大魔王AlphaGO 太凶恶了

Links booklink

Contact Us: admin [ a t ] ucptt.com