[外絮] 腾讯最新AI在SC2上击败作弊电脑

楼主: andy920262 (andy920262)   2018-09-26 14:23:15
原始论文:
https://arxiv.org/pdf/1809.07193v1.pdf
我本身是SC2玩家也对AI稍有研究,最近刚好看到这篇上礼拜才发表的论文,台湾似乎还没什么新闻或讨论。
这篇应该是目前第一篇“公开”研究声称可以“进行整场游戏并击败玩家”的论文,先前SC2的研究都是只能进行小游戏的程度。
简单来讲,腾讯发表了2个不同的AI称为TStarBot1跟TStarBot2在深海礁岩这张地图进行ZvZ游戏,APM限制在400-800。
TStarBot1是跟电脑对局了700万场自我学习的,TStartBot2则是没有经过学习直接被人类给予规则的AI(Rule-base AI)。
这两只AI对上作弊电脑分别取得80%跟90%的胜率,并成功击败白金~钻石段位的玩家(不过场次很少)。
不过论文中有提到,TStarBot1在玩了700万场后学到胜率最高的招式是异化虫快攻,因此对上真实玩家多打几场就会被破解。
而TStarBot2使用的战术就比较多元,但以AI研究的角度来看,Rule-base AI就只是根据人类赋予的知识进行游戏,并没有办法自行学习更强的战术,因此现在的AI研究多半是自我学习为重点。
技术细节的部分我就不提了,有兴趣了解的可以推文我尽量解答￿。
重点就是现在SC2 AI的研究还只能打打电脑,先前天梯高端有AI出没的传言多半是假的,不然就是除了腾讯外有其他尚未公开的研究在测试,虽然个人认为机率不高就是了。
作者: homelife (SKY)   2018-09-26 14:45:00
之前在API发表之后,Deepmind玩SC2似乎都还没有消息?
作者: ws870325 (不懂)   2018-09-26 14:45:00
700万场只会12d???
作者: kira925 (1 2 3 4 疾风炭)   2018-09-26 14:48:00
700万场的Z学会了一个12D...而且是ZvZ...
作者: eternalviva (老人)   2018-09-26 14:51:00
应该不是只学会12D 而是12D效率最佳 XD学T的时候 大概也是每一场2BB
作者: homelife (SKY)   2018-09-26 15:00:00
没有读档案内文,但如果是照AlphaGO的模式,一开始应该是从AI连规则都不清楚就让他自己摸索?
作者: fragmentwing (片翼碎梦)   2018-09-26 15:10:00
deepmind的不是还在人族建筑起飞战术?
作者: lather (煞气ㄟ溺水)   2018-09-26 15:13:00
2bb 12D 野bg 应该都是最高的 博弈心态再加上操作
作者: kira925 (1 2 3 4 疾风炭)   2018-09-26 15:16:00
400~800APM也太高了 200~400才合理吧看了下内容 他直接做了165个Macro 换句话说他已经先绑好AI会做什么子动作了...不能说偷鸡拉 因为确实这些动作是可以先设定好的但是就不是从0开始
作者: penut85420 (PenutGGorz)   2018-09-26 15:22:00
我觉得一开始有些Marco应该还算合理,如果一出世就有个Rule Base而且没绑脚本感觉有点太可怕。不过很看好他的前景,期许有天可以改善游戏内建的AI,甚至有机会指导玩家哪些细节需要改善发现笔误,不是说Rule Base而是只有纯输入Rule
作者: aegis43210 (宇宙)   2018-09-26 15:40:00
强化奖励的部份最难
作者: zero790425 (ULTIMATE)   2018-09-26 16:00:00
AIp要是碾压另外两族ai算不算是pimba(被拉走
作者: Adonisy (堂本瓜一)   2018-09-26 16:20:00
谢谢你告诉我12D转大龙
作者: abc0922001 (中士abc)   2018-09-26 16:59:00
能打赢作弊难度的电脑很厉害欸
作者: qqq87112 (kaim)   2018-09-26 17:00:00
以为看到吃肉人族 先打电脑
作者: win4104 (BB)   2018-09-26 17:36:00
12D胜感觉...很靠赛
作者: firefoxriko (自由主义者的忠心测试)   2018-09-26 19:16:00
感觉ai条件比新人还差,新人还能上网找攻略,AI看攻略的话就被说作弊了。
作者: zseineo (Zany)   2018-09-26 19:33:00
因为目标不一样啊XD
作者: firefoxriko (自由主义者的忠心测试)   2018-09-26 20:02:00
我只是想说这样还打的赢很厉害,我看了攻略都没能打赢
作者: kirimaru73 (雾丸)   2018-09-26 21:28:00
其实从来就没有规定AI不能参考这个参考那个只是那只狗Re:0的威能太大 所有人都会想拿来比一下
作者: wiki2548 (Wiki2548)   2018-09-26 21:30:00
期待像围棋一样能探索出一个全新的世界
作者: only1032 (萤幕小键盘)   2018-09-26 21:51:00
二楼好好笑
作者: shiyhsien (好人界终身成就奖)   2018-09-26 23:30:00
我APM只有100不到
作者: Mensholaten (REAL)   2018-09-26 23:33:00
星海的变化比围棋复杂太多 要training很久才有可能适应各种情况吧
作者: rodney228 (繁星)   2018-09-27 03:54:00
看了一下,Bot1只是给了165个"基本概念"比如什么是挖矿攻击的时候要点选目标、什么是科技之类的deepmind则是故意什么都不教?只是APM设计得有点太高了,职业选手也很难一直这样更何况,学习战术、操作一定程度之后,理论上Bot不会有操作失误吧
作者: kira925 (1 2 3 4 疾风炭)   2018-09-27 08:25:00
Deepmind是故意什么都不教 Bot1是先设定好了一点结构不是不可以拉 但是要详细看到写得多死
作者: jim8596 (休刊是童年的回忆)   2018-09-28 15:38:00
我还以为最强是ai是甩毒爆的枪兵而且rouge曾经出现2000apm过 限制不为过吧
作者: kira925 (1 2 3 4 疾风炭)   2018-09-28 15:43:00
那我用加速键盘丢蛋瞬间APM破万也算吗...
作者: amsmsk (449)   2018-09-28 21:58:00
2000APM是产单位吧

Links booklink

Contact Us: admin [ a t ] ucptt.com