Re: [问题] 为何不研发LOL的AlphaGo?

楼主: tonylo2ooo (Logo)   2017-05-26 09:23:37
我刚好研究所是念机器学习的,
平时对人工智能跟类神经网络应用在游戏上也有一些研究,
提供给你最一线的资讯参考一下。
因为这些名词都是原文书或是论文里面会用到的,等等会有一些专有名词来源是英文
我会简单的翻译一下,所以有更好的名词翻译欢迎提出。
※ 引述《z50905 (z50905)》之铭言:
: 看完棋王对AlphaGo的第二场对决
: 实在感叹 AlphaGo经过了上亿场演算经验的学习
AlphaGo的理论我想网络上很多文章了,这边不多说。
重点就是(你也已经知道)AlphaGO是借由输入棋谱,加上对弈增强的即可。
: 成长到了人类无法想像的世界
因为资讯的交流在电脑世界是用电的速度,而人脑因为受限于神经传导素的速度,
跟输出媒介(手脚,或是广泛一点说是肌肉),
或是靠发展几千年的语言,累积的深厚codec,用少量的文字笔画代表背后深厚的意涵。
: 不禁有个疑问
: 本身就是用电脑进行的LOL
: 也有玩家VS电脑的选项 但感觉电脑都废废的
这边要想讲,AI有两种,一种是Rule-Based,也就是借由大量的判断式来模拟人类
例如:敌方残血->算伤害后完美接一套
自己残血->算对面的魔量 伤害等等,撤退
这样的AI很容易被玩家抓到漏洞并且exploitation(反复操作特定动作来获胜)
例如中阶电脑以前会一直追玩家,你就可以在开场二塔去拖怪,拖到自家塔下杀赚钱。
另一种则是像AlphaGo一样的,一开始什么都不会,但是每做错一次就会回馈
回神经网络去强化或是抑制特定行为,也就像人脑一般。
需要大量长时间的训练,成千上万甚至数亿次的对决,每个细微的操作都会回馈给网络
拿马力欧来举例的话 可以看这影片:
https://www.youtube.com/watch?v=qv6UVOQ0F44
一开始AI什么都不会玩,一直送。
这跟rule-based借由人知道不要送头写一个残血回家的code是不同的。
: 要创造出AlphaGo等级的LOL电脑应该满容易的吧
其实DeepMind已经着手在星海争霸上面进行学习了,
https://www.youtube.com/watch?v=5iZlrBqDYPM
但为什么不挑LOL? 因为人的因素太多,AI没办法对胜负有全盘的掌握
也就是说,除了对手之外,AI还要考虑剩下四个会不会心态炸裂然后放推
说不定AI这整波的操作其实是很棒的,结果一个人忽然送头输掉
这样会增加训练的难度,因为人的变异数太大。
: 毕竟电脑不会有反射神经时间 反应速度都趋近于0秒
这我有一点点小意见,因为人的反应还需要经过脑袋的思考,
多么简单的步骤都是经过处理的。也就是AI也是要把它接收到的资讯丢进神经网络
然后回馈,或许也是需要几ms甚至好几分钟的。
有兴趣去看一下alphaGo的对弈,你会发现AI会想很久,
因为它正在进行决策树的裁减跟硬爆。
(把一些很不可能的动作去掉,然后细算那些可能的操作)
另一方面,对,这是用电生理(神经传导素) 跟 纯电流的差别
统计来说,你的眼睛看到画面,到大脑最后做出反应大概有80ms的差距
: 大家觉得有可能创造出LOL版阿法狗吗
可以,但有几个原因
1. 前面说过,浪费时间,因为人的变量太多
一次训练五台一起打又有难度,不如训练一个StarCarft,从部队数量到控兵都可以掌握
连基地的建设,摆放位置等等训练起来,跟LOL谁简单都还很难说,
但是可以让人知道AI对战局全盘的掌握度。
LOL只能控一只,没办法展现那种像是围棋对弈中的大局观。
2. 有在看星海比赛都知道,任何部队的交换都是绑定经济(晶矿与瓦斯)
也就是AI会有一个立即可以回馈的函数。
每一支兵的交换他可以知道这波 “亏还是不亏”,
这可以让AI从小会战的操作跟大局配置分开来训练。
类似有些选手吃兵操作不好,但是大局观很强。(西...门?)
: PS:现行LOL电脑VS玩家
: 在地图的黑暗处电脑的五个玩家真的有在运行吗?
: 例如打野那些 求解
这边问题没看懂,先跳过。
最后回应一下推文内有一些错误的观念,像是什么跟现在走位外挂有关的。
现在看到星海的暴力AI,或是LOL辅助程式,
都是透过写死的神奇走位拉打做出来的。
也就是他单位跑速比你快的时候,你毒爆虫滚到死也炸不到半只。
李星Q到死都Q不中。
机枪兵(远程小兵)整队边散边拉打,APM突破天际。
但是DeepMind现在在做的AI,是连毒爆虫来了要散兵都不知道,
再没有任何人类给定预备知识的情况,只根据每只单位,加上总体经济的交换来目的。
而且是有被限制APM的(应该是最高200-240左右),APM对他来说就像资源。
也就是AI如果发现用细节操作散兵,就能一直赢,他就满足了。
但如果发现APM239/240都拿去操作,家里乱乱盖,都不能赢,
他就会把一部分操作资源拿去探视野之类的。
所以推文中提到那种变态AI,跟我们这边讨论的alphaGo以类神经网络为主的不同。
十年后可能除了围棋AI对决之外,
还有星海AI对决,而且用的接口可能跟人类差不多,限制最大APM
并且画面转换要绑定鼠标DPI啊,
那些都要固定,然后来一场公正的AI 星海对决。
作者: PerfectFlash (完美闪现)   2017-05-26 09:33:00
恩恩 跟我想的一样
作者: RyneSandberg (小熊传奇)   2017-05-26 09:36:00
写的好
作者: snowmanturtl (森之杰尼龟)   2017-05-26 09:37:00
做出一队AI 会不会比较简单?
作者: howard841013 (complexacid)   2017-05-26 09:52:00
暂停好扯......好像漫画的情节
作者: qazwsx879345 (qazwsx879345)   2017-05-26 10:08:00
U文
作者: zZzZzZzZ5566 (天龙人)   2017-05-26 10:24:00
认真优文
作者: yeswater5566 (悦氏矿泉水56)   2017-05-26 11:13:00
u文
作者: ysesst911840 (apink teba)   2017-05-26 11:35:00
好猛的文
作者: yapdasccryay (濑尿牛丸)   2017-05-26 11:50:00
U文
作者: s56565566123 (OnlyRumble)   2017-05-26 12:27:00
那bp可以研发吗
作者: heveninferno (欧给)   2017-05-26 14:26:00
作者: ArayaHellCat (喵喵)   2017-05-26 14:29:00
优文推
作者: redickshot25   2017-05-26 14:44:00
U质推推
作者: YuenYang5566   2017-05-26 18:02:00
世纪帝国的弓手就像你说的会个别拉打散开

Links booklink

Contact Us: admin [ a t ] ucptt.com