Re: [闲聊] AI打星海争霸,后来如何?

楼主: ephraim13825 (好喔)   2022-08-30 18:50:40
看到很多人都讲到AI靠操作这件事
因为大学时期有稍微了解做过报告 而且以前对这游戏还满有热情的
https://imgur.com/xmSgUU7.jpg
虽然实力不是最高 但还是讲一点自己的看法好了
先贴上相关网站文件 有兴趣可以看一下
研究简介
https://reurl.cc/dWy2rk
Paper
https://reurl.cc/V1MDXQ
那时候的研发背景是 AlphaGo在称霸围棋后 deepmind想往更深的领域挑战
所以想试试看如果今天是走法不固定的RTS AI会怎么去判断
当时还很多人觉得AI只能在有限制的范围内赢人类 在这种多变又要有地图观的游戏
内是无法比过人类的
一开始的版本就是前面看到的比赛版本
全视野(没有迷雾都能看到) 280APM(有效操作) 350ms延迟 等等
所以当时有许多争议
1.正常人只能看到你画面中的物件
AI可以同时观看到所有能见的区域 所以就能多线同时对应
所以在最后一场把视野关掉后 AI才不像以前可以同时做多线判断
而且被搞到不知道该守哪边输掉
2.人往往会做出无意义的操作
虽然官方的APM是280 比一般选手都还要低很多
但是AI走的是一次到位的判断 人类却会有多余的动作
例如我今天要控制单位从A到B AI会这样走
https://imgur.com/L5W4Xqm.jpg
但人类却会是这样走
https://imgur.com/nKg8zoC.jpg
同样一个路径上点好几次慢慢往前 为了应付可能突然出现的意外
这样造成明明是相同的判断 普通人要比AI多花好几倍的操作数去完成
因为开发者不一定懂游戏 也不清楚实际的运作方式
所以在这次比赛结束后 deepmind重新思考了研究条件 并做出了几个修改
只能对会面内的物件做判断 且只能控制画面内的单位
不只神族 而且三个种族同时进行训练
与选手沟通 限制所有操作 反应时间 以至所呈现的结果都必须与人类相当
在修改完从新学习闭关修练后
https://reurl.cc/60dZWO
deepmind与暴雪合作 宣告会默默把AI投入进游戏天梯对战内 并随机配对人类玩家
且会不断换帐号 避免过多次来被发现是AI
结果在与人类同等的条件下 所有种族的AI都能爬到游戏最高的宗师阶级
且比游戏内绝大部分的玩家强 这场AI对战也就到这边结束
结论就是就算是走法几乎无限的RTS类游戏 AI也能透过判断来取胜
在这之后他们研究蛋白质应用在医学领域又是另一个故事了
作者: bootes3177 (石榴姐姐)   2022-08-30 18:56:00
想到帅五进一
作者: oldriver (oldriver)   2022-08-30 19:01:00
投入魔兽世界 搞不好会比随团队友还强
作者: stu199712   2022-08-30 19:03:00
作者: rhox (天生反骨)   2022-08-30 19:05:00
我也有研究所同学做AI爬炉石天梯的研究
作者: chejps3105 (氋氃)   2022-08-30 19:05:00
我听deepmind之前演讲的说法是他们一开始用有战争迷雾发现训练起来超烂,甚至连去找对手都不会,所以先全开训练等到有阶段性成果才把战争迷雾加回来。而不是他们不懂游戏,他们内部工程师都有下去自己玩过
楼主: ephraim13825 (好喔)   2022-08-30 19:08:00
我只的不懂是操作参数的部分他们可能认为280已经比绝大多数的选手低了 但不知道AI并不会有所谓的累赘动作 所以实际效果还是会被玩家强很多
作者: doremon1293 (模仿者)   2022-08-30 19:09:00
宗室是在那个服打的?
楼主: ephraim13825 (好喔)   2022-08-30 19:09:00
*会比
作者: henry1234562 (亨利二十三)   2022-08-30 19:09:00
实际上280APM如果只是平均的也是没啥用
楼主: ephraim13825 (好喔)   2022-08-30 19:10:00
对 原本会战会飙到1000 所以后面平均更最高都有调整到一般玩家水准
作者: doremon1293 (模仿者)   2022-08-30 19:11:00
AI操作不会失误 小地图不会漏看 就算一样条件还是很有优势
作者: shasen1236 (亚特兰提斯のSsin)   2022-08-30 19:24:00
以前我也追星海好几年,但如果只是设这简单限制和靠胜负得到这个结果,其实意义也不大AI最大的意义在于是否能帮人类想出更好的决策,只有这种简单限制对于AI的操作根本没差,重点在于结论有没有得出什么时候该多线,分多少兵,或者该不该换家,单纯上宗师的AI应该打从星海上市第一天就能做了
楼主: ephraim13825 (好喔)   2022-08-30 19:28:00
主要还是测AI在没有固定落点的游戏会怎么走 算是比棋盘游戏进步更大了
作者: kira925 (1 2 3 4 疾风炭)   2022-08-30 19:31:00
当时结论好像天梯爬到五千多还六千多分吧 再上去就没了但那个时候这游戏也没多少人了...APM280印象中也不是真的平均 那次比赛有瞬间拉出1500那个瞬间大家就知道整个训练都歪了
作者: teller526 (大嘴巴)   2022-08-30 19:35:00
不过不得不说打天梯跟番战还是差蛮多的 天梯双方都可能不知道对方 但番战就是双方各种针对战术
楼主: ephraim13825 (好喔)   2022-08-30 19:37:00
平均280是因为平时只执行最低需求 不会像玩家一直疯狂圈单位切画面 所以很常在100左右 最高又不受限 才会不平衡 后续与选手讨论调整成符合人类的标准
作者: km850105 (赤月之双子)   2022-08-30 20:16:00
不过宗师也只是职业的等级而已接近本作级的职业选手会有7000up的分
作者: jjjj222 (绿色药水)   2022-08-30 21:09:00
这个结果可以说明RTS主要就是打失误的,压迫造成对手失误, 谁失误少谁就赢了

Links booklink

Contact Us: admin [ a t ] ucptt.com