Re: [闲聊] AI打星海争霸,后来如何?

楼主: kuoyipong (petohtalrayn)   2022-08-30 17:55:46
: 大家可以看 2:10:16 开始的部分 https://youtu.be/cUTMhmVh1qs?t=7816
: 这时候AlphaStar有一大票追猎者,看起来非常凶悍。
: 但 Mana 只要用棱镜把部队运到对方家里骚扰,AlphaStar的大军就会班师回朝
: 战斗上 AlphaStar 只有“大部队集结抗衡敌人”的概念
: 同时,AlphaStar 策略上也不太屌兵种对抗优劣,从头至尾贯彻“追猎者最棒!”
: 这个大家在猜是因为AlphaStar觉得这兵种在消耗上最有效率
: 然后面对 Mana 的 不朽+破坏能 大军,AlphaStar一样用追猎者上去对干。
: 想当然尔当然是输了 从人类的角度看起来这兵种对抗要赢实在太难了
我觉得这部分当然应该是训练给的APM相关参数有问题
也就是说给AI的APM上限还是太高,导致AI可以靠操作硬干
我个人的推测是AI对局那个两百年数据量,不太可能没有用到不朽
那如果数据里面有不朽结果还是敢用追猎硬推,而且确实也给他推成功了
那简单来说就是这种微操无敌的兵种对AI来说太强
强到一般人类理解的优劣跟AI对局时的优劣是不同的
其实个人觉得星海一部分的问题在这里
有没有微操的情况下兵种强度存在差异
微操算是职业选手的基本功
虽然AI做出来的微操有点太离谱,但其实在一般人眼中选手的微操也很离谱
而重点是-不同微操能力下兵种克制的状态也不同
就像一般人而言被毒爆冲生化会被换的很伤
但对选手而言,伤不伤取决于你散兵的能力
因此同理,对AI而言
如果部队交战时的微操对对局的影响大于你运营、策略、兵种克制的影响
那AI就会倾向于在部队交战时微操最大化
那就会回归上面那个前提-APM设定太高导致兵种克制的概念与人类不同
某程度确实算是训练失败,因为前提与人类有明显差距
但可以5:0可能代表在AI那个APM之下,闪追干正面是局部最佳解
就跟人类以前找出来的三不朽等局部最佳解类似
: 当然你可以说结果就是 4:1 ,AlphaStar屌虐。
: 但我同时也相信那个时间点找其他人类高手跟AlphaStar打,
: AlphaStar的赢面应该是很低。因为策略认知上的缺陷被Mana暴露出来了
我是觉得AI的策略有时候是这样
AI的局部最佳解不一定跟人类的局部最佳解一样
而星海这个游戏的微操会大幅影响游戏的特质
让AI只要在操作上设定的不够贴近人类,那他得到的答案就会跟人类差距很大
以前围棋没有所谓的微操问题
具体来说只有每一步有多少思考时间的差别
但星海争霸这款微操会影响策略的游戏
这次AI让人不服气的点是交战时APM过高导致兵种克制与我们认知的差距太大
但其实AI下棋的时候也有类似的状况
很多职业棋手看到AI的下法都会困惑,更会直接建议初学者不要学AI的下法
因为AI的策略不会告诉你他的逻辑是什么
所以直接说AI的策略有问题可能只是人类的一厢情愿
因为可能在AI的领域中,那个策略问题都是可以解决的
也因此回到前面的部分,你要为AI设下多少限制才“公平”
这次是闪追猎的操作上限太高,职业选手也做不到这个上限
所以变成骑摩托车跑一百公尺那种感觉
但是AI的自我对局中,大家(自己跟自己的分身)都是骑摩托车的
所以策略都是基于骑摩托车来发展
不过似乎这计画没有要继续做下去
所以也很难看到AI再压低APM之后的策略转变了
作者: tonyy801101 (tonyy801101)   2022-08-30 17:58:00
手速太高基本上不是跟AI打,是跟外挂打那个人类也做不到的操作基本上就是不公平的存在
作者: lsd25968 (cookie)   2022-08-30 18:00:00
是说AI是不是情蒐都做得很到位? 大招有用吗XD 虽然我想大招成功几次后 AI懂得怎么防了就没用了
作者: hh123yaya (KID)   2022-08-30 18:01:00
情蒐也是要牺牲单位去巡逻才有 AI有养成吗?不管有没有情蒐都闪追干死你的话 也没必要情蒐了
作者: arrenwu (键盘的战鬼)   2022-08-30 18:01:00
@lsd25968 你讲的这种思考方式是人类的思考方式
作者: goliath   2022-08-30 18:01:00
早期搞人的手段 微操好可以解决七八成吧
作者: Senkanseiki (戦舰栖姫)   2022-08-30 18:02:00
问题是高手速前提下大招可能都不是大招,我记得之前AI被先知搞结果损失都是微乎其微
作者: arrenwu (键盘的战鬼)   2022-08-30 18:02:00
另外关于APM的部分,我没有相关证据,但我自己认为APM会设定成我们看到的那种高度很可能是因为如果不这样设定AlphaStar可能没办法训练到能拿出来DEMO的程度
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:03:00
同意在ai的apm下 会有和人类玩家不同的meta
作者: arrenwu (键盘的战鬼)   2022-08-30 18:03:00
至少我觉得没啥道理他如果 APM 150就能打赢人类他会需要给到 300 APM毕竟这项实验,APM设定越低 结果的价值就越高
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:05:00
这也是RTS对游戏公司而言为难的地方 最早期人族打针高阶玩家无敌中低阶就是被滚烂烧烂 没有一个平衡性是能高低阶环境兼顾的
作者: goliath   2022-08-30 18:05:00
毕竟实验结果是跟你说AI和人的apm操作结果不同了
作者: tasin (Ringo)   2022-08-30 18:05:00
选手的微操不会在一般人眼中离谱啊 做不到而已 ai那个叫肉眼看就知道人类做不到
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:07:00
不不选手的操作看起来也一点都不像人类啊 每个都像有四只手 屏幕一秒刷一次的
作者: cycy771489 (曾经的信徒)   2022-08-30 18:08:00
取消战争迷雾,AI还会选择爆单一兵种吗?
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:08:00
而且像parting也有打过完全无损闪追操作赢下一局 那也是很非人类
作者: arrenwu (键盘的战鬼)   2022-08-30 18:08:00
取消战争迷雾那玩的就不是星海争霸了
作者: hh123yaya (KID)   2022-08-30 18:09:00
其实这也牵扯到游戏本身平衡的方向了 兵种的操作性本来就在平衡的考量中
作者: cycy771489 (曾经的信徒)   2022-08-30 18:10:00
先让他学习
作者: jeeyi345 (letmein)   2022-08-30 18:10:00
本来想看策略 结果AI觉得微操就够了
作者: Senkanseiki (戦舰栖姫)   2022-08-30 18:11:00
问题是这其实不是这种AI的训练方式
作者: arrenwu (键盘的战鬼)   2022-08-30 18:12:00
是啊 你不能想像他是个人类XD
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:12:00
当初会选星海来训练就是因为不像围棋,星海有迷雾吧
作者: arrenwu (键盘的战鬼)   2022-08-30 18:13:00
我听到的也是想尝试看看RL下AI在非全知游戏下的表现
作者: jeeyi345 (letmein)   2022-08-30 18:15:00
不然回去比非即时呢
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:15:00
回到职业选手 先不管地图快捷 一般大后期为了闪AOE和方便施法 加上要顾后方 控制群组至少要6、7个时时紧盯 这你觉得是人类干得出来的事?
作者: NoLimination (啊啊啊啊)   2022-08-30 18:15:00
结果AI:战争迷雾?闪现追猎能解决一切问题
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:16:00
非即时到alphago养好就已经不用再比啦
作者: goliath   2022-08-30 18:16:00
按键太多 手就开始跟不上脑袋了 AI可没这个问题
作者: arrenwu (键盘的战鬼)   2022-08-30 18:18:00
另外,策略认知有无问题是结果论。不是说AI在模拟环境觉得这是最佳解那就正确
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:21:00
职业选手恐怖就在那些按键脑袋和手都能处理 而且是非公式化的应对 至少在serral碾压的时候是这么一回事 欧美的大后期灵活打法更胜韩国的公式化打法
作者: tasin (Ringo)   2022-08-30 18:28:00
Serral明明是个完美呈现公式化应对到极致的玩家XD 所以他最不会打ZVZ这种主动的对抗
作者: chang1248w (彩棠)   2022-08-30 18:32:00
要说准备战术不得不提bo无敌的男人rogue看他打zvz根本艺术
作者: KuBiLife (人生苦逼)   2022-08-30 18:35:00
就AI发现剪刀石头布里面石头其实是手榴弹他学怎么丢手榴弹就好 管他剪刀跟布
作者: black80731 (坏坏)   2022-08-30 18:40:00
之前有 没限制的 影片ai的可以 把部队散开 闪aoe 太扯
楼主: kuoyipong (petohtalrayn)   2022-08-30 18:42:00
AlphaStar有限制,但看来限制太宽松导致AS得到的结果就是闪追OP然后凤凰强无敌
作者: Minesweeper (lleh)   2022-08-30 18:44:00
没限制不就跟悍马一样,有意义吗
作者: kluele585 (漆黑烈焰大魔法师)   2022-08-30 18:55:00
事实上你指的 人类不知道AI这么做的原因是什么<—这点这几年一直是研究的方向之一 以围棋举例好了 现在的AI已经能告诉你出这步棋他为什么这么下 好是好在哪里 甚至人类下一手也能分析出胜率跟优劣
作者: Minesweeper (lleh)   2022-08-30 19:32:00
看胜率本来就可以了吧,能够自解释倒是闻所未闻,哪家的围棋ai?要解释这一手好在哪,是什么解释法?
作者: pleaseask (请问)   2022-08-30 19:46:00
ai自练,可能因为总是在找最佳化策略(而非针对所有策略的应对模式),最终的答案就是闪追互打,打了几千万局之后就只是一直优化这个策略,人类出奇招(甚至只是很普通的偷家)就会让ai整个错愕然后失常
楼主: kuoyipong (petohtalrayn)   2022-08-30 20:01:00
其实奇招是有考虑的而且结论就是,你就算奇招还是打不赢我闪追(远目)至少这五场闪追都是强到超乎人类所知的策略
作者: km850105 (赤月之双子)   2022-08-30 20:09:00
阿法星当初去打天梯也被养坏,被三族各路大招快攻搞到只会大召然后韩国的星海风和欧洲完全不同,想搞出kespa鼎盛期韩国的大将级选手机乎不可能

Links booklink

Contact Us: admin [ a t ] ucptt.com