[外絮] 腾讯最新AI在SC2上击败作弊电脑 andy920262 PTT批踢踢实业坊

[外絮] 腾讯最新AI在SC2上击败作弊电脑

楼主: andy920262 (andy920262) 2018-09-26 14:23:15

原始论文：
https://arxiv.org/pdf/1809.07193v1.pdf
我本身是SC2玩家也对AI稍有研究，最近刚好看到这篇上礼拜才发表的论文，台湾似乎还没什么新闻或讨论。
这篇应该是目前第一篇“公开”研究声称可以“进行整场游戏并击败玩家”的论文，先前SC2的研究都是只能进行小游戏的程度。
简单来讲，腾讯发表了2个不同的AI称为TStarBot1跟TStarBot2在深海礁岩这张地图进行ZvZ游戏，APM限制在400-800。
TStarBot1是跟电脑对局了700万场自我学习的，TStartBot2则是没有经过学习直接被人类给予规则的AI(Rule-base AI)。
这两只AI对上作弊电脑分别取得80%跟90%的胜率，并成功击败白金~钻石段位的玩家(不过场次很少)。
不过论文中有提到，TStarBot1在玩了700万场后学到胜率最高的招式是异化虫快攻，因此对上真实玩家多打几场就会被破解。
而TStarBot2使用的战术就比较多元，但以AI研究的角度来看，Rule-base AI就只是根据人类赋予的知识进行游戏，并没有办法自行学习更强的战术，因此现在的AI研究多半是自我学习为重点。
技术细节的部分我就不提了，有兴趣了解的可以推文我尽量解答。
重点就是现在SC2 AI的研究还只能打打电脑，先前天梯高端有AI出没的传言多半是假的，不然就是除了腾讯外有其他尚未公开的研究在测试，虽然个人认为机率不高就是了。

作者: homelife (SKY) 2018-09-26 14:45:00

之前在API发表之后，Deepmind玩SC2似乎都还没有消息?

作者: ws870325 (不懂) 2018-09-26 14:45:00

700万场只会12d???

作者: kira925 (1 2 3 4 疾风炭) 2018-09-26 14:48:00

700万场的Z学会了一个12D...而且是ZvZ...

作者: eternalviva (è€äºº) 2018-09-26 14:51:00

应该不是只学会12D 而是12D效率最佳 XD学T的时候大概也是每一场2BB

作者: homelife (SKY) 2018-09-26 15:00:00

没有读档案内文，但如果是照AlphaGO的模式，一开始应该是从AI连规则都不清楚就让他自己摸索?

作者: fragmentwing (片翼碎梦) 2018-09-26 15:10:00

deepmind的不是还在人族建筑起飞战术？

作者: lather (煞气ㄟ溺水) 2018-09-26 15:13:00

2bb 12D 野bg 应该都是最高的博弈心态再加上操作

作者: kira925 (1 2 3 4 疾风炭) 2018-09-26 15:16:00

400~800APM也太高了 200~400才合理吧看了下内容他直接做了165个Macro 换句话说他已经先绑好AI会做什么子动作了...不能说偷鸡拉因为确实这些动作是可以先设定好的但是就不是从0开始

作者: penut85420 (PenutGGorz) 2018-09-26 15:22:00

我觉得一开始有些Marco应该还算合理，如果一出世就有个Rule Base而且没绑脚本感觉有点太可怕。不过很看好他的前景，期许有天可以改善游戏内建的AI，甚至有机会指导玩家哪些细节需要改善发现笔误，不是说Rule Base而是只有纯输入Rule

作者: aegis43210 (宇宙) 2018-09-26 15:40:00

强化奖励的部份最难

作者: zero790425 (ULTIMATE) 2018-09-26 16:00:00

AIp要是碾压另外两族ai算不算是pimba(被拉走

作者: Adonisy (堂本瓜一) 2018-09-26 16:20:00

谢谢你告诉我12D转大龙

作者: abc0922001 (中士abc) 2018-09-26 16:59:00

能打赢作弊难度的电脑很厉害欸

作者: qqq87112 (kaim) 2018-09-26 17:00:00

以为看到吃肉人族先打电脑

作者: win4104 (BB) 2018-09-26 17:36:00

12D胜感觉...很靠赛

作者: firefoxriko (自由主义者的忠心测试) 2018-09-26 19:16:00

感觉ai条件比新人还差，新人还能上网找攻略，AI看攻略的话就被说作弊了。

作者: zseineo (Zany) 2018-09-26 19:33:00

因为目标不一样啊XD

作者: firefoxriko (自由主义者的忠心测试) 2018-09-26 20:02:00

我只是想说这样还打的赢很厉害，我看了攻略都没能打赢

作者: kirimaru73 (雾丸) 2018-09-26 21:28:00

其实从来就没有规定AI不能参考这个参考那个只是那只狗Re:0的威能太大所有人都会想拿来比一下

作者: wiki2548 (Wiki2548) 2018-09-26 21:30:00

期待像围棋一样能探索出一个全新的世界

作者: only1032 (萤幕小键盘) 2018-09-26 21:51:00

二楼好好笑

作者: shiyhsien (好人界终身成就奖) 2018-09-26 23:30:00

我APM只有100不到

作者: Mensholaten (REAL) 2018-09-26 23:33:00

星海的变化比围棋复杂太多要training很久才有可能适应各种情况吧

作者: rodney228 (繁星) 2018-09-27 03:54:00

看了一下，Bot1只是给了165个"基本概念"比如什么是挖矿攻击的时候要点选目标、什么是科技之类的deepmind则是故意什么都不教?只是APM设计得有点太高了，职业选手也很难一直这样更何况，学习战术、操作一定程度之后，理论上Bot不会有操作失误吧

作者: kira925 (1 2 3 4 疾风炭) 2018-09-27 08:25:00

Deepmind是故意什么都不教 Bot1是先设定好了一点结构不是不可以拉但是要详细看到写得多死

作者: jim8596 (休刊是童年的回忆) 2018-09-28 15:38:00

我还以为最强是ai是甩毒爆的枪兵而且rouge曾经出现2000apm过限制不为过吧

作者: kira925 (1 2 3 4 疾风炭) 2018-09-28 15:43:00

那我用加速键盘丢蛋瞬间APM破万也算吗...

作者: amsmsk (449) 2018-09-28 21:58:00

2000APM是产单位吧

继续阅读

[情报] TaeJa重新加入Team Liquidrichard82010 [联赛] BZS:May(炽热青春) 例行赛 #17AzureRush [情报] 本周异变：长眠安息fragmentwing [实况] 一个有趣的比赛LWC0227 [专访] 已为人父的人类皇太子“恶魔羊”DScain1187 [情报] StarCrafts Season 6 Ep 18 Deep Troublefragmentwing [问题] 泉水沟战术再现?!! ZvZ 猥琐战术orange0319 [实况] 台湾虫王 SEn (收播)OldYellowDog OSC直播LWC0227 [问题] 早期工兵闹矿到底是从何时开始的?orange0319