Fw: [情报] AlphaZero战胜将棋与西洋棋最强软件 asglay PTT批踢踢实业坊

Fw: [情报] AlphaZero战胜将棋与西洋棋最强软件

楼主: asglay (收收收尾) 2017-12-07 00:15:41

※ [本文转录自 GO 看板 #1Q9-Ito- ]
作者: HeterCompute (异质运算) 看板: GO
标题: [情报] AlphaZero战胜将棋与西洋棋最强软件
时间: Wed Dec 6 20:38:11 2017
https://arxiv.org/pdf/1712.01815.pdf
这次论文的标题是：
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
从零学棋，
使用相似的神经网络架构，
一样没有使用任何人类知识，
4小时打败西洋棋最强软件Stockfish，
2小时打败将棋最强软件Elmo，
34小时打败围棋AlphaGoZero 20blocks 3天版本，
(围棋其实有些争议，因为他这次用了5000TPU，上次AlphaGoZero只用2000TPU)，
以MCTS打倒传统的alpha beta search，
通用于完全讯息游戏，
又一伟大的突破。

作者: staristic (ANSI lover) 2016-12-06 20:45:00

一个通用于下棋的AI？

作者: tetratio (彻拉修) 2016-12-06 20:50:00

又达到新境界了

作者: BBSealion (海狮) 2016-12-06 20:54:00

不知道限制多严格，有运气成分的（例如暗棋）或多人的（例如跳棋）不知道能否通用过去

作者: birdy590 (Birdy) 2016-12-06 20:55:00

力王：大家可以回家啦~

作者: harrybbs (harrybbs) 2016-12-06 20:59:00

逆天啦发展这么快

作者: dongy (孤星...) 2016-12-06 21:01:00

暗棋可以计算机率的,但因复杂度不高,且有部分运气,所以人类棋手会有一定胜率

作者: TWN2 (.....) 2016-12-06 21:04:00

想看阿法零跟赤木茂打麻将

作者: zeat (L.) 2016-12-06 21:06:00

AlphaGO老师：我是说在座的各位都是＿＿

作者: aegis43210 (宇宙) 2016-12-06 21:15:00

已经征服完全讯息游戏了，希望星海二也会有突破

作者: s891234 (嘟噜咑) 2016-12-06 21:41:00

真的是在座的各位都是哈哈，可以回家啦~~~

作者: Lordaeron (Terry) 2016-12-06 21:43:00

多人跟双人是有很多不同,没问题就有鬼囉.

作者: turing (涂妮) 2016-12-06 22:22:00

这也终结了西洋棋的西西里防御。

作者: MonkeyCL (猴总召) 2016-12-06 22:35:00

这世界变化太快好累啊

作者: hne (hne ) 2016-12-06 22:52:00

太强了 O o

楼主: asglay (收收收尾) 2016-12-07 00:11:00

借转chess

作者: ssccg (23) 2017-12-07 00:35:00

虽然算法很强，但是真的有资源能玩更是关键...不知道在电王的规则下多强就是了

作者: lwei781 (nap til morning?) 2017-12-07 01:43:00

应该差不多强耗资源的部分是训练

作者: ssccg (23) 2017-12-07 02:30:00

实战用的是4TPU，先不说电王没TPU，TPU是CPU的几十倍吧?64T vs 4TPU感觉不算公平，当然再多训练下去一定是Alpha强

作者: NewYAWARA (朝霞之前奏) 2017-12-07 10:11:00

请他们明年到电王战比一次就知道了，现在的elmo也不是最强，而且大家有被限制统一硬件规格

作者: fossil313 (阵雨) 2017-12-07 12:25:00

跟StockFish每秒搜寻7000k比 AlphaZero只有搜寻80k感觉应该是没什么悬念了

作者: ssccg (23) 2017-12-07 12:58:00

在一个node上要做的evaluation不同，不能比NPS吧AlphaZero比较强是一定的，只是好奇TPU优化的程式用4TPU跑要改写成一般CPU能跑的话会是要多少CPU才有同样强度

作者: NewYAWARA (朝霞之前奏) 2017-12-07 20:16:00

后来测试最新tanuki确实是比elmo强

作者: kcl0801 (kcl) 2017-12-08 13:10:00

新电王ぽんぽこ近日直播时正式上线被日本观众嫌的要死xd因为预测的太短视刚上直播时常常只预测下一步昨天看时好一点可是在画面上有预测后9步的空间却完美的只默认了8步空一格...

作者: ssccg (23) 2017-12-08 13:52:00

那是UI和探索引擎配合的问题吧

继续阅读

[将棋] 羽生善治夺取龙王达成永世七冠壮举NewYAWARA [它棋] 以棋会友，有人对下象棋有兴趣吗(增人)a10120108 Re: [西洋] 请问棋局为何莫名结束了？LukeForward [闲聊] 小型棋类变体的流行程度Neisseria [西洋] 卡斯帕洛夫的手表china2025 在日本，围棋和西洋棋的流行程度shimanda019 [将棋] 洋化的将棋表示法Neisseria Re: [问题] 西洋棋变体创作请教Neisseria [将棋] 有关子力评估的疑问Neisseria [约战] 日本将棋十月棋聚kenny359259