Re: [问题] AlphaGo Zero来玩死人棋会无敌吗?

楼主: can18 (18号)   2019-07-02 19:42:38
※ 引述《kai851121 (arrkaiii)》之铭言:
: 看了这篇 快受不了
: 我以为lol版 一堆肥宅工程师
: 结果没一个有认真在想的
: 来
: 为什么不能用算得
: 1.棋子移动方式随机性高
随机性过程确实会比决定性过程复杂
但目前主流用的 MDP 本来就是 model 随机过程
决定性过程只是特例 目前要处理随机过程完全不是问题
(就像 atari game 也很多随机性 概念简单的DQN就照样玩的比人类好)
: 2.技能施放随机性高
: 几乎没有办法复制任何一套对局
: 这代表什么?
: 需要更多的事件来累积对局总量
: 再加上
同上 这完全不是问题
: 3.一局狗干30分钟
: 这不像围棋两个ai狂下猛下累积次数
: 一局不用几秒
: 30分钟一局欸
你怎不说围棋一盘要下多久 = =
电玩游戏是为了让人类看懂才跑的慢
真的要跑大部分的时间会是输入 input 给 model 跑出 prediction 的时间
游戏回应的时间根本可以忽略
另外就算无法自己实现游戏所以无法加快
也可以蒐集人类玩的经验做 off-line learning
: 我是不知道神经网络它设计是几层啦
: 但是我看算完到算法出来
: 英雄联盟大概倒了
: 说不定60岁拿来回味还有点搞头
:

Links booklink

Contact Us: admin [ a t ] ucptt.com