Re: [情报] 最新星海AI十比零血洗人类职业玩家

楼主: EvilSD (邪星暗(Usagi))   2019-01-25 11:07:54
持续一直有再追踪这件事,不过这次的比赛结果
确实让我非常惊讶
先来简单介绍一下DeepMid是如何训练这个AlphaStar的
https://www.youtube.com/watch?v=5iZlrBqDYPM
上面这段影片就是他们在让AI学习的过程
一般常见的游戏AI
都是直接读取游戏内部参数
然后透过写好的脚本直接下去做执行
简单来说就是让AI根据不同种时间状况作相对应的决定与抉择
但DeepMid并不是如此,DeepMid使用的是深度学习的方式
(如今我已经很难想像他们在这次AlphaStar是如何建构深度学习网络的)
我们在回到刚刚的影片
影片上的左边有四个画面
这就是所谓的特征提取的动作
也就是AlphaStar在建立模型与学习的时候
是透过即时的影像进行,而不是透过读取游戏参数使用脚本的方式
困难点在哪呢?
普遍现在不论是学界与工业界
大家成熟的深度学习架构(也可以说现在最常见的AI)
大多数都是读取一个画面内的特征参数进行学习
如果要简单解释就是,今天给你一张照片上面有只狗
那AI辨识后就说这是狗,这是所谓的Classification
照片上有只狗还能标记出在哪里
那就是Classification + Localization
照片上有很多种物体并且都能标记出位子
就是 Object Detection(也就是目前智慧车常用的方式)
还有另一种叫做Semantic Segmentation
是将画面上的每一个pixel去做标记
那AlpahStar做了些什么呢
首先在早期的API里
里面可以同时学习20个Semantic Segmentation
而且是即时的,所以我甚至怀疑其实是Instance Segmentation
那单纯只是学习这些画面困难点在哪呢?
时间与未知(战争迷雾)
因为以前的AlphaGO
围棋的大小是一个既定19X19的范围
所以我下完一子后,我可以全局重新判断
但星海完全不是如此
第一 星海的地图资讯很多是未知的,所以我们才要防空投探图等
第二 星海的游戏是时间连续的,也就是我上一秒钟做的事情会影响到下一秒钟
跟围棋完全不一样,不是下完一子后重新扫描全局
所以困难点非常的多,在特征提取上大概能够理解
但多特征合并后进行学习,又要保持时间上学习不会误差放大(如传统RNN)
(传统RNN在学习连续性资料后,往往一开始学习的资讯会遗忘或是误差放大
因此后来才有了深度学习版本的LSTM与biLSTM)
上述的内容可能还是有点艰深难懂,但我已经尽可能讲得比较简单一些
总而言之大家现在讨论的是APM 操作上的问题
但我看见的是,能透过视觉的方式
让AI学习玩星海争霸二
还能够将游戏时间拉长并且与职业选手对战
我是觉得很不可思议
还是那种....完全无法想像他们训练出这个模型的状态
真的真的 非常的吃惊(原本以为这至少也要五年才能够突破的瓶颈)
作者: tsairay (火の红宝石)   2019-01-25 11:14:00
电影描绘的未来...越来越接近了...
作者: sumarai (Pawn)   2019-01-25 11:14:00
觉得可以办AI对AI打星海,看看谁的AI最极限
作者: reinhert (史丹佛的银色子弹)   2019-01-25 11:14:00
那个影片已经是两年多前的东西了,现在的AlphaStar应该不是照搬
作者: nok1126 (Nok)   2019-01-25 11:15:00
钢铁擂台
作者: tim32142000 (许B)   2019-01-25 11:18:00
表演赛,世界冠军打AI
作者: elwing (鸟儿)   2019-01-25 11:19:00
Instance(个体)=/= instant(立即)好吗?semantics segmentation=对每一个像素划分类别 instance segmentation=不
作者: RaiGend0519 (Named RaiGend)   2019-01-25 11:19:00
以后会出现一种比赛:民间客制AI对抗客制AI
作者: jerryae86 (Justdoit_MM)   2019-01-25 11:41:00
有打赢的影片可以看吗
作者: arrenwu (键盘的战鬼)   2019-01-25 11:42:00
作者: gigayaya (gigayaya)   2019-01-25 11:44:00
网络我记得是用LSTM
作者: ARHAN (脑脑的阿贤脑脑的^.^\~/)   2019-01-25 11:46:00
攻杀虫 484不懂Semantic跟Instance差别
作者: elwing (鸟儿)   2019-01-25 11:50:00
基本上segmentation只是把分类问题和侦测问题提高到像素级别 那你都知道object detection难于classification 怎么会觉得semantics(像素级别的classificatiin) 会简单于 instance(像素级别的object detection)呢?抱歉 上面笔误 怎么会觉得semantics难于instance
作者: vnon (路人)   2019-01-25 12:08:00
deepmind有把介绍放在他们的部落格上了,先去看看吧..
作者: ruledesign (ruledesign)   2019-01-25 13:17:00
RL吧
作者: K60258 (储存勇气~)   2019-01-25 13:54:00
不太懂就先研究,别急着秀呀

Links booklink

Contact Us: admin [ a t ] ucptt.com