Re: [闲聊] AI打星海争霸,后来如何?

楼主: ephraim13825 (好喔)   2022-08-30 18:50:40
看到很多人都讲到AI靠操作这件事
因为大学时期有稍微了解做过报告 而且以前对这游戏还满有热情的

虽然实力不是最高 但还是讲一点自己的看法好了
先贴上相关网站文件 有兴趣可以看一下
研究简介
https://reurl.cc/dWy2rk
Paper
https://reurl.cc/V1MDXQ
那时候的研发背景是 AlphaGo在称霸围棋后 deepmind想往更深的领域挑战
所以想试试看如果今天是走法不固定的RTS AI会怎么去判断
当时还很多人觉得AI只能在有限制的范围内赢人类 在这种多变又要有地图观的游戏
内是无法比过人类的
一开始的版本就是前面看到的比赛版本
全视野(没有迷雾都能看到) 280APM(有效操作) 350ms延迟 等等
所以当时有许多争议
1.正常人只能看到你画面中的物件
AI可以同时观看到所有能见的区域 所以就能多线同时对应
所以在最后一场把视野关掉后 AI才不像以前可以同时做多线判断
而且被搞到不知道该守哪边输掉
2.人往往会做出无意义的操作
虽然官方的APM是280 比一般选手都还要低很多
但是AI走的是一次到位的判断 人类却会有多余的动作
例如我今天要控制单位从A到B AI会这样走

但人类却会是这样走

同样一个路径上点好几次慢慢往前 为了应付可能突然出现的意外
这样造成明明是相同的判断 普通人要比AI多花好几倍的操作数去完成
因为开发者不一定懂游戏 也不清楚实际的运作方式
所以在这次比赛结束后 deepmind重新思考了研究条件 并做出了几个修改
只能对会面内的物件做判断 且只能控制画面内的单位
不只神族 而且三个种族同时进行训练
与选手沟通 限制所有操作 反应时间 以至所呈现的结果都必须与人类相当
在修改完从新学习闭关修练后
https://reurl.cc/60dZWO
deepmind与暴雪合作 宣告会默默把AI投入进游戏天梯对战内 并随机配对人类玩家
且会不断换帐号 避免过多次来被发现是AI
结果在与人类同等的条件下 所有种族的AI都能爬到游戏最高的宗师阶级
且比游戏内绝大部分的玩家强 这场AI对战也就到这边结束
结论就是就算是走法几乎无限的RTS类游戏 AI也能透过判断来取胜
在这之后他们研究蛋白质应用在医学领域又是另一个故事了
作者: bootes3177 (石榴姐姐)   2022-08-30 18:56:00
想到帅五进一
作者: oldriver (oldriver)   2022-08-30 19:01:00
投入魔兽世界 搞不好会比随团队友还强
作者: stu199712   2022-08-30 19:03:00
作者: rhox (天生反骨)   2022-08-30 19:05:00
我也有研究所同学做AI爬炉石天梯的研究
作者: chejps3105 (氋氃)   2022-08-30 19:05:00
我听deepmind之前演讲的说法是他们一开始用有战争迷雾发现训练起来超烂,甚至连去找对手都不会,所以先全开训练等到有阶段性成果才把战争迷雾加回来。而不是他们不懂游戏,他们内部工程师都有下去自己玩过
楼主: ephraim13825 (好喔)   2022-08-30 19:08:00
我只的不懂是操作参数的部分他们可能认为280已经比绝大多数的选手低了 但不知道AI并不会有所谓的累赘动作 所以实际效果还是会被玩家强很多
作者: doremon1293 (模仿者)   2022-08-30 19:09:00
宗室是在那个服打的?
楼主: ephraim13825 (好喔)   2022-08-30 19:09:00
*会比
作者: henry1234562 (亨利二十三)   2022-08-30 19:09:00
实际上280APM如果只是平均的也是没啥用
楼主: ephraim13825 (好喔)   2022-08-30 19:10:00
对 原本会战会飙到1000 所以后面平均更最高都有调整到一般玩家水准
作者: doremon1293 (模仿者)   2022-08-30 19:11:00
AI操作不会失误 小地图不会漏看 就算一样条件还是很有优势
作者: shasen1236 (亚特兰提斯のSsin)   2022-08-30 19:24:00
以前我也追星海好几年,但如果只是设这简单限制和靠胜负得到这个结果,其实意义也不大AI最大的意义在于是否能帮人类想出更好的决策,只有这种简单限制对于AI的操作根本没差,重点在于结论有没有得出什么时候该多线,分多少兵,或者该不该换家,单纯上宗师的AI应该打从星海上市第一天就能做了
楼主: ephraim13825 (好喔)   2022-08-30 19:28:00
主要还是测AI在没有固定落点的游戏会怎么走 算是比棋盘游戏进步更大了
作者: kira925 (1 2 3 4 疾风炭)   2022-08-30 19:31:00
当时结论好像天梯爬到五千多还六千多分吧 再上去就没了但那个时候这游戏也没多少人了...APM280印象中也不是真的平均 那次比赛有瞬间拉出1500那个瞬间大家就知道整个训练都歪了
作者: teller526 (大嘴巴)   2022-08-30 19:35:00
不过不得不说打天梯跟番战还是差蛮多的 天梯双方都可能不知道对方 但番战就是双方各种针对战术
楼主: ephraim13825 (好喔)   2022-08-30 19:37:00
平均280是因为平时只执行最低需求 不会像玩家一直疯狂圈单位切画面 所以很常在100左右 最高又不受限 才会不平衡 后续与选手讨论调整成符合人类的标准
作者: km850105 (赤月之双子)   2022-08-30 20:16:00
不过宗师也只是职业的等级而已接近本作级的职业选手会有7000up的分
作者: jjjj222 (绿色药水)   2022-08-30 21:09:00
这个结果可以说明RTS主要就是打失误的,压迫造成对手失误, 谁失误少谁就赢了

Links booklink

Contact Us: admin [ a t ] ucptt.com