Fw: [情报] AlphaZero战胜将棋与西洋棋最强软件

楼主: asglay (收收收尾)   2017-12-07 00:15:41
※ [本文转录自 GO 看板 #1Q9-Ito- ]
作者: HeterCompute (异质运算) 看板: GO
标题: [情报] AlphaZero战胜将棋与西洋棋最强软件
时间: Wed Dec 6 20:38:11 2017
https://arxiv.org/pdf/1712.01815.pdf
这次论文的标题是:
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
从零学棋,
使用相似的神经网络架构,
一样没有使用任何人类知识,
4小时打败西洋棋最强软件Stockfish,
2小时打败将棋最强软件Elmo,
34小时打败围棋AlphaGoZero 20blocks 3天版本,
(围棋其实有些争议,因为他这次用了5000TPU,上次AlphaGoZero只用2000TPU),
以MCTS打倒传统的alpha beta search,
通用于完全讯息游戏,
又一伟大的突破。
作者: staristic (ANSI lover)   2016-12-06 20:45:00
一个通用于下棋的AI?
作者: tetratio (彻拉修)   2016-12-06 20:50:00
又达到新境界了
作者: BBSealion (海狮)   2016-12-06 20:54:00
不知道限制多严格,有运气成分的(例如暗棋)或多人的(例如跳棋)不知道能否通用过去
作者: birdy590 (Birdy)   2016-12-06 20:55:00
力王:大家可以回家啦~
作者: harrybbs (harrybbs)   2016-12-06 20:59:00
逆天啦 发展这么快
作者: dongy (孤星...)   2016-12-06 21:01:00
暗棋可以计算机率的,但因复杂度不高,且有部分运气,所以人类棋手会有一定胜率
作者: TWN2 (.....)   2016-12-06 21:04:00
想看阿法零跟赤木茂打麻将
作者: zeat (L.)   2016-12-06 21:06:00
AlphaGO老师:我是说在座的各位都是__
作者: aegis43210 (宇宙)   2016-12-06 21:15:00
已经征服完全讯息游戏了,希望星海二也会有突破
作者: s891234 (嘟噜咑)   2016-12-06 21:41:00
真的是在座的各位都是哈哈,可以回家啦~~~
作者: Lordaeron (Terry)   2016-12-06 21:43:00
多人跟双人是有很多不同,没问题就有鬼囉.
作者: turing (涂妮)   2016-12-06 22:22:00
这也终结了西洋棋的西西里防御。
作者: MonkeyCL (猴总召)   2016-12-06 22:35:00
这世界变化太快好累啊
作者: hne (hne )   2016-12-06 22:52:00
太强了 O o
楼主: asglay (收收收尾)   2016-12-07 00:11:00
借转chess
作者: ssccg (23)   2017-12-07 00:35:00
虽然算法很强,但是真的有资源能玩更是关键...不知道在电王的规则下多强就是了
作者: lwei781 (nap til morning?)   2017-12-07 01:43:00
应该差不多强 耗资源的部分是训练
作者: ssccg (23)   2017-12-07 02:30:00
实战用的是4TPU,先不说电王没TPU,TPU是CPU的几十倍吧?64T vs 4TPU感觉不算公平,当然再多训练下去一定是Alpha强
作者: NewYAWARA (朝霞之前奏)   2017-12-07 10:11:00
请他们明年到电王战比一次就知道了,现在的elmo也不是最强,而且大家有被限制统一硬件规格
作者: fossil313 (阵雨)   2017-12-07 12:25:00
跟StockFish每秒搜寻7000k比 AlphaZero只有搜寻80k感觉应该是没什么悬念了
作者: ssccg (23)   2017-12-07 12:58:00
在一个node上要做的evaluation不同,不能比NPS吧AlphaZero比较强是一定的,只是好奇TPU优化的程式用4TPU跑要改写成一般CPU能跑的话会是要多少CPU才有同样强度
作者: NewYAWARA (朝霞之前奏)   2017-12-07 20:16:00
后来测试最新tanuki确实是比elmo强
作者: kcl0801 (kcl)   2017-12-08 13:10:00
新电王ぽんぽこ近日直播时正式上线 被日本观众嫌的要死xd因为预测的太短视 刚上直播时常常只预测下一步 昨天看时好一点 可是在画面上有预测后9步的空间 却完美的只默认了8步空一格...
作者: ssccg (23)   2017-12-08 13:52:00
那是UI和探索引擎配合的问题吧

Links booklink

Contact Us: admin [ a t ] ucptt.com