论文:https://deepmind.com/documents/110/sc2le.pdf
如果AI以点击为输入接口的话,星海每个动作估计有10^8个可能性,相较之下,19路围棋
每步棋最多只有19x19种可能性。
战争迷雾有特殊的图形接口让AI知道战争迷雾在哪里(见论文图2)。
APM设定成180,换算一下就是AI一秒最多只能下三道指令。
关于学习的部分,首先DM让AI自己跟自己左右互搏,一场最多打30分钟,超时算平手,学
到最后和内建最简单的电脑1v1测试,AI一场也没赢过,只有平手或输掉两种结果(见论文
图5)。
之后DM让AI去看800K个replay,这800K个replay从最低端到职业玩家都有,AI从这些
replay学习局面判断能力。游戏刚开始的时候,因为输赢机率一样,所以AI预测准确率为
50%。游戏进行到愈后面AI准确率愈高,在游戏时间15分钟的时候AI有65%机率猜对最后结
果(见论文图8)。
然后DM让AI模仿replay里面玩家的行为,论文最后只提到AI会去生产一些军事单位(见论
文图9),没提到能不能打赢最简单的电脑......