Re: [问题] 为何不研发LOL的AlphaGo? tonylo2ooo PTT批踢踢实业坊

Re: [问题] 为何不研发LOL的AlphaGo?

楼主: tonylo2ooo (Logo) 2017-05-26 09:23:37

我刚好研究所是念机器学习的，
平时对人工智能跟类神经网络应用在游戏上也有一些研究，
提供给你最一线的资讯参考一下。
因为这些名词都是原文书或是论文里面会用到的，等等会有一些专有名词来源是英文
我会简单的翻译一下，所以有更好的名词翻译欢迎提出。
※ 引述《z50905 (z50905)》之铭言：
: 看完棋王对AlphaGo的第二场对决
: 实在感叹 AlphaGo经过了上亿场演算经验的学习
AlphaGo的理论我想网络上很多文章了，这边不多说。
重点就是（你也已经知道）AlphaGO是借由输入棋谱，加上对弈增强的即可。
: 成长到了人类无法想像的世界
因为资讯的交流在电脑世界是用电的速度，而人脑因为受限于神经传导素的速度，
跟输出媒介（手脚，或是广泛一点说是肌肉），
或是靠发展几千年的语言，累积的深厚codec，用少量的文字笔画代表背后深厚的意涵。
: 不禁有个疑问
: 本身就是用电脑进行的LOL
: 也有玩家VS电脑的选项但感觉电脑都废废的
这边要想讲，ＡＩ有两种，一种是Rule-Based，也就是借由大量的判断式来模拟人类
例如：敌方残血->算伤害后完美接一套
自己残血->算对面的魔量伤害等等，撤退
这样的ＡＩ很容易被玩家抓到漏洞并且exploitation(反复操作特定动作来获胜)
例如中阶电脑以前会一直追玩家，你就可以在开场二塔去拖怪，拖到自家塔下杀赚钱。
另一种则是像AlphaGo一样的，一开始什么都不会，但是每做错一次就会回馈
回神经网络去强化或是抑制特定行为，也就像人脑一般。
需要大量长时间的训练，成千上万甚至数亿次的对决，每个细微的操作都会回馈给网络
拿马力欧来举例的话可以看这影片：
https://www.youtube.com/watch?v=qv6UVOQ0F44
一开始ＡＩ什么都不会玩，一直送。
这跟rule-based借由人知道不要送头写一个残血回家的code是不同的。
: 要创造出AlphaGo等级的LOL电脑应该满容易的吧
其实DeepMind已经着手在星海争霸上面进行学习了，
https://www.youtube.com/watch?v=5iZlrBqDYPM
但为什么不挑LOL？因为人的因素太多，ＡＩ没办法对胜负有全盘的掌握
也就是说，除了对手之外，ＡＩ还要考虑剩下四个会不会心态炸裂然后放推
说不定ＡＩ这整波的操作其实是很棒的，结果一个人忽然送头输掉
这样会增加训练的难度，因为人的变异数太大。
: 毕竟电脑不会有反射神经时间反应速度都趋近于0秒
这我有一点点小意见，因为人的反应还需要经过脑袋的思考，
多么简单的步骤都是经过处理的。也就是ＡＩ也是要把它接收到的资讯丢进神经网络
然后回馈，或许也是需要几ms甚至好几分钟的。
有兴趣去看一下alphaGo的对弈，你会发现ＡＩ会想很久，
因为它正在进行决策树的裁减跟硬爆。
（把一些很不可能的动作去掉，然后细算那些可能的操作）
另一方面，对，这是用电生理(神经传导素) 跟纯电流的差别
统计来说，你的眼睛看到画面，到大脑最后做出反应大概有80ms的差距
: 大家觉得有可能创造出LOL版阿法狗吗
可以，但有几个原因
1. 前面说过，浪费时间，因为人的变量太多
一次训练五台一起打又有难度，不如训练一个StarCarft，从部队数量到控兵都可以掌握
连基地的建设，摆放位置等等训练起来，跟LOL谁简单都还很难说，
但是可以让人知道ＡＩ对战局全盘的掌握度。
LOL只能控一只，没办法展现那种像是围棋对弈中的大局观。
2. 有在看星海比赛都知道，任何部队的交换都是绑定经济（晶矿与瓦斯）
也就是ＡＩ会有一个立即可以回馈的函数。
每一支兵的交换他可以知道这波 “亏还是不亏”，
这可以让ＡＩ从小会战的操作跟大局配置分开来训练。
类似有些选手吃兵操作不好，但是大局观很强。（西...门?）
: PS:现行LOL电脑VS玩家
: 在地图的黑暗处电脑的五个玩家真的有在运行吗?
: 例如打野那些求解
这边问题没看懂，先跳过。
最后回应一下推文内有一些错误的观念，像是什么跟现在走位外挂有关的。
现在看到星海的暴力ＡＩ，或是ＬＯＬ辅助程式，
都是透过写死的神奇走位拉打做出来的。
也就是他单位跑速比你快的时候，你毒爆虫滚到死也炸不到半只。
李星Ｑ到死都Ｑ不中。
机枪兵(远程小兵)整队边散边拉打，ＡＰＭ突破天际。
但是DeepMind现在在做的ＡＩ，是连毒爆虫来了要散兵都不知道，
再没有任何人类给定预备知识的情况，只根据每只单位，加上总体经济的交换来目的。
而且是有被限制ＡＰＭ的（应该是最高200-240左右），ＡＰＭ对他来说就像资源。
也就是ＡＩ如果发现用细节操作散兵，就能一直赢，他就满足了。
但如果发现ＡＰＭ239/240都拿去操作，家里乱乱盖，都不能赢，
他就会把一部分操作资源拿去探视野之类的。
所以推文中提到那种变态ＡＩ，跟我们这边讨论的alphaGo以类神经网络为主的不同。
十年后可能除了围棋ＡＩ对决之外，
还有星海ＡＩ对决，而且用的接口可能跟人类差不多，限制最大ＡＰＭ
并且画面转换要绑定鼠标DPI啊，
那些都要固定，然后来一场公正的ＡＩ星海对决。

作者: PerfectFlash (完美闪现) 2017-05-26 09:33:00

恩恩跟我想的一样

作者: RyneSandberg (小熊传奇) 2017-05-26 09:36:00

写的好

作者: snowmanturtl (森之杰尼龟) 2017-05-26 09:37:00

做出一队AI 会不会比较简单？

作者: howard841013 (complexacid) 2017-05-26 09:52:00

暂停好扯......好像漫画的情节

作者: qazwsx879345 (qazwsx879345) 2017-05-26 10:08:00

U文

作者: zZzZzZzZ5566 (天龙人) 2017-05-26 10:24:00

认真优文

作者: yeswater5566 (悦氏矿泉水56) 2017-05-26 11:13:00

u文

作者: ysesst911840 (apink teba) 2017-05-26 11:35:00

好猛的文

作者: yapdasccryay (濑尿牛丸) 2017-05-26 11:50:00

U文

作者: s56565566123 (OnlyRumble) 2017-05-26 12:27:00

那bp可以研发吗

作者: heveninferno (欧给) 2017-05-26 14:26:00

推

作者: ArayaHellCat (喵喵) 2017-05-26 14:29:00

优文推

作者: redickshot25 2017-05-26 14:44:00

U质推推

作者: YuenYang5566 2017-05-26 18:02:00

世纪帝国的弓手就像你说的会个别拉打散开

继续阅读

[外絮] WildTurtle : TSM → FlyQuestfkc [揪团] ARAM 咆哮深渊ballney [闲聊] 队友说三个月后再跟她说哪里玩的不好Aruka0924 [实况] Søren Bjerg / TSM Bjergsennanoshooter [揪团] 晨跑NGevilisnear [实况] 刺刺的钻四人马王ym19950822 [问题] 求救我的LOL.....adam00159 [新闻] ESPN评SKT王朝：是否有利于游戏的发展 zkow [问题] 被海鲜74团喷该怎么办x4068 [闲聊] 大家玩艾希会近距离丢大冰箭吗？nhshlebron01