[将棋] 第27回世界电脑将棋大赛 ssccg PTT批踢踢实业坊

[将棋] 第27回世界电脑将棋大赛

楼主: ssccg (23) 2017-05-04 21:53:30

http://www2.computer-shogi.org/wcsc27/
二次预选决胜
elmo 8-1 7-0
Ponanza Chainer 8-1 6-1 (输elmo)
技巧 6-3 4-3 (输elmo、ponanza、読み太)
大合神クジラちゃん 6-3 4-3 (输elmo、ponanza、技巧)
苍天幻想ナイツ・オブ・タヌキ 5-4 3-4
読み太 6-3 2-5
HoneyWaffle 6-3 2-5
NineDayFever 5-3-1 0-7
=== 晋级决胜 ===
大将军 5-4
Qhapaq 5-4
nozomi 5-4
Apery 5-4
这次Ponanza导入了deep learning、1092 CPU + 128 GPU的Cluster
号称对去年电王战版的Ponanza胜率超过80%
原本想说可能没什么好看的...
结果又有让Ponanza拿到败场的软件出现
elmo是最近出现在floodgate上、rating超过4000的monkeymagic
参赛使用的硬件只用2 CPU的主机
预定赛后也会公开，又有新玩具可以用了

作者: merhi0506 (白目光) 2017-05-04 23:25:00

电脑赛为什么会连下两手理解不能

楼主: ssccg (23) 2017-05-05 00:36:00

在轮到对方下的时候，传送不合法的指令到server，被判定为违规，其实不是真的送了下一手指令，只是规则上算二手指しelmo要2连胜ponanza了不知道是将棋跟DNN的相性问题，还是只是学习时间还不够

作者: NeedGem (本当傻蛋的宿命) 2017-05-05 16:53:00

觉得围棋只要机率过就好比较适合 DNN...将棋需要严格的将死才算数不太好用 DNN # 除非入玉.赛后... 只有棋谱和评价参数, 程式: Y王!!!!!

楼主: ssccg (23) 2017-05-05 17:02:00

やねうら王根本场外参战了，在比赛中推出新版本

作者: NewYAWARA (朝霞之前奏) 2017-05-05 17:27:00

有点横空出世的味道…而且是免费的，看来千田可以好好利用一下了elmo: https://goo.gl/HEhL6M

作者: NeedGem (本当傻蛋的宿命) 2017-05-05 17:40:00

他不负责写 engine, 他的努力都在棋谱和评价参数上了.

作者: NewYAWARA (朝霞之前奏) 2017-05-05 17:40:00

看了一下决赛，双方用的是主流的换角48金37桂29飞，后来elmo争取到入玉过程中大幅棋得，最后直接打趴pona

作者: NeedGem (本当傻蛋的宿命) 2017-05-05 17:42:00

https://pbs.twimg.com/media/C_DEIZmUwAErQ44.jpg从这边到可以赢... 嗯相较于大合神集众人之力还是被那两个玩假的... 囧也许是因为去年Y王本尊有赢到Pona才会有人想这种可能 @@Y王本人觉得这个比赛没钱赚所以不会自己下去拼吧 (X)应该说将棋不太适合直接把 DNN 丢上去用...

楼主: ssccg (23) 2017-05-05 19:18:00

クジラ好像用去年电王版本的Apery(这次参赛的Apery也是)众人之力的效果还是看的出来啦...明年要拿到优胜可能至少要比クジラ+elmo强，可能要R4500+?elmo看说明是从Apery开始加上各家的学习方法，主要改善终盘的强度，从上面那局面可以守住ponanza的进攻可以看出这方面可能是目前最强的吧

作者: NeedGem (本当傻蛋的宿命) 2017-05-06 10:00:00

试验一下炎之七番胜负第七局终盘, 用elmo评价参数之后...真的很快就在某一手看到... 28 手诘 (羽生已完蛋)Engine 终盘初测: Apery >= Y王 > silent_majority(魔女)初步乱来的终盘检证: http://0rz.tw/lebXG (放巴哈...)

楼主: ssccg (23) 2017-05-07 01:42:00

差不多各家都公开了(差技巧)，各家的特色好像是qhapaq序盘强，読み太是单机强化版的Y牌引擎(可是我试觉得没Y4.41+强)pona跟alphago比了一下，DNN好像只有policy network，只用在决定各分枝探索的顺序上，剩下的就是cluster化，评价值好像都没提到，说不定就是都没有动...评价准确度输人的话找的快也没用，2~4名都是NPS几亿的cluster但是输千万级的elmoalphago在评价用了rollout和value network，value network在攻王类的好像CP值不好，rollout在将棋这种不知道什么时候结束的不知道效果如何...不过方法上应该还是有尝试的空间pona的policy准确率55%跟alphago的57%已经差不多了，再来重点还是要放在改善评价方法，至于引擎跟ML比较没关系，比较看写程式的人最佳化的功力了

作者: NeedGem (本当傻蛋的宿命) 2017-05-07 06:19:00

deep learning 的正确用途目前可能是拿来练评价参数.但是现行的二三驹关系不排除可能也有所侷限 (思)攻王需要的是正确的手顺, 用 value network 有其困难点.除了 kk/kpp/kkp 那套之外该有新的评价想法了

楼主: ssccg (23) 2017-05-07 06:39:00

新想法就技巧啊，只是这次没练赢...现在学习用的局面是用传统评价自我对战生的，加上policynetwork也许能用比较少的时间生出这些资料?

作者: NeedGem (本当傻蛋的宿命) 2017-05-07 07:01:00

刚刚把 usapyon2 dash 丢进 elmo 的 kk/kpp/kkp...当机了wwwwww

楼主: ssccg (23) 2017-05-08 02:10:00

技巧2出了，可以调强度和战型，这可以卖了吧...

作者: NeedGem (本当傻蛋的宿命) 2017-05-10 16:13:00

偷偷试一下检讨棋... 结果三种软件套elmo检讨出来不一样(著名实况台: 魔女 # 这边根据之前测试使用 Apery/Y王)太难了先摆一边... 囧

作者: lwei781 (nap til morning?) 2017-12-07 01:46:00

有新的大魔王AlphaGO 太凶恶了

继续阅读

[公告] 关于samtinum板友文章处理NewYAWARA [西洋] 来谈谈现代西洋棋在世界上如此风行的原因skyhawkptt Re: [问卦] 西洋棋、象棋、将棋geken Re: [问卦] 西洋棋、象棋、将棋geken Re: [西洋] 有没有能够展示棋谱的游戏或APP呢?POKELJ Re: [西洋] 有没有能够展示棋谱的游戏或APP呢?skyhawkptt [西洋] 有没有能够展示棋谱的游戏或APP呢?aswin12000 [它棋] 请问跳棋可以跳进他人的颜色里吗?QOO222 [将棋] 加藤桃子重回奖励会初段einstean [将棋] 16本将棋电子书超大特价NewYAWARA