Re: [新闻] 暴雪结合DeepMind人工智能 开发星海争霸2

楼主: freshmints (只求早點休息)   2016-11-06 01:54:39
※ 引述《dulinove (C.A.B.A.L
作者: Aggro (阿果)   2016-11-06 01:56:00
我想到闪电霹雳车的阿斯拉
作者: FallenAngelX (跌倒)   2016-11-06 01:58:00
只能推
作者: twosheep0603 (两羊)   2016-11-06 02:03:00
我觉得今天会这样混淆应该是AI这个词太过泛滥
作者: Aksky (喔!喔!!喔!!!)   2016-11-06 02:08:00
我倒是想看DeepMind被人换家会有啥反映,说不定挺有趣的XD
作者: fosa (阿盛)   2016-11-06 02:09:00
AlphaGO被搞怎么会哭呢...就是一场败场把过程输入数据库而已
作者: GOBS (GodOfBullShit)   2016-11-06 02:10:00
我觉得阿法狗玩星海应该很快就学会"侦查"的重要性了在资讯越多的情况下它就可以付出越少的运算空间再推断对方的行为 而且它的学习系统包括模仿对局 只要多看一点高端场应该就知道一些侦查的时间点 像是第一支王虫 何时出OB之类的
作者: w60904max (自宅警备队员)   2016-11-06 02:13:00
围棋还有思考时间 这真的一大挑战
作者: GOBS (GodOfBullShit)   2016-11-06 02:15:00
...你要这样说讲得好像人类玩的时候不需要花资源侦查当电脑意识到这样的侦查是必要时它就会跟着做了
作者: Aksky (喔!喔!!喔!!!)   2016-11-06 02:16:00
侦查还要考虑对手的战术欺骗,不可能每场都照表操课的
作者: arrenwu (键盘的战鬼)   2016-11-06 02:17:00
AlphaGO 下围棋也没有所谓的完美啊他只是在以知的范围内找一个看起来最ok的做法而已
作者: Sischill (Believe or not)   2016-11-06 02:18:00
你只讲到微操 那请问多线呢? 人脑在天生就没电脑能够快
作者: kinghtt (万年潜水伕)   2016-11-06 02:18:00
要AI崩溃得先确定星海的可能性分支有比围棋多
作者: arrenwu (键盘的战鬼)   2016-11-06 02:19:00
我觉得星海要处理的部分是资料的部分
作者: siyaoran (七星)   2016-11-06 02:19:00
AlphaGO玩快棋弱很多 这真的对它是一大挑战
作者: Sischill (Believe or not)   2016-11-06 02:19:00
微操结果家里营运或小地图漏看都会发生 问题是对电脑来说会发生这种错误嘛?
作者: kinghtt (万年潜水伕)   2016-11-06 02:20:00
阿法狗在面对选择时会走胜算最高的步数,直到对手改变
作者: ttt95217 (略)   2016-11-06 02:20:00
电脑打星海应该很强吧 可以微控一队远程兵?
作者: kinghtt (万年潜水伕)   2016-11-06 02:21:00
策略才会再次计算可能性,星海中可以选择稳健发展策略
作者: w60904max (自宅警备队员)   2016-11-06 02:22:00
我想是确定敌方战术后 就照设定的最佳解执行下去了
作者: kinghtt (万年潜水伕)   2016-11-06 02:22:00
让胜算维持一定程度
作者: arrenwu (键盘的战鬼)   2016-11-06 02:22:00
星海只是知道的比较少而已,当下还是有最佳的策略遇到前面有陷阱之后,就会有另一个策略
作者: GOBS (GodOfBullShit)   2016-11-06 02:23:00
对抗埋地毒爆电脑会出渡鸭吧 面对隐形单位最高CP的做法
作者: w60904max (自宅警备队员)   2016-11-06 02:23:00
然后微操 交战 都靠rule直接解 跟一般游戏AI一样
作者: arrenwu (键盘的战鬼)   2016-11-06 02:23:00
除了资料输入之外,星海跟围棋没有差那么多
作者: Sischill (Believe or not)   2016-11-06 02:23:00
我想前面有埋地毒爆/雷 这跟电脑或人脑没啥关系 都是靠
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:24:00
google先想办法生出SC的算法吧,能下围棋是因为有对应
作者: twosheep0603 (两羊)   2016-11-06 02:24:00
玩星海算不算挑战让电脑解Bayesian game的平衡点啊
作者: kinghtt (万年潜水伕)   2016-11-06 02:24:00
直到玩家被侦测到确定的一手后电脑再改变策略就好
作者: Sischill (Believe or not)   2016-11-06 02:24:00
侦查探知的吧?
作者: w60904max (自宅警备队员)   2016-11-06 02:26:00
他指的是从答案 执行操作的部分吧deep learing 只是帮你先整理好可能状况 及对应答案围棋那套 有另一个快速从model寻找最佳解的算法
作者: arrenwu (键盘的战鬼)   2016-11-06 02:28:00
我是觉得只要情报一样,加上训练资料够多,电脑是应该要能够赢过人脑的
作者: twosheep0603 (两羊)   2016-11-06 02:29:00
人脑做的事情也一样啊 整理情报 做对应动作只是deep learning把这个过程高度抽象化了啊其实好像不能说是抽象 对人类抽象但对数学具体
作者: arrenwu (键盘的战鬼)   2016-11-06 02:31:00
你讲的第六感说穿了是职业选手经验的累积迅速解读
作者: twosheep0603 (两羊)   2016-11-06 02:33:00
第六感的赌某种意义上跟蒙地卡罗方法是一样的XD
作者: kinghtt (万年潜水伕)   2016-11-06 02:33:00
阿法狗下围棋不是靠暴力演算破解…而是会整理可能性分支游戏中的第六感就是玩家根据经验法则归纳出的可能性
作者: twosheep0603 (两羊)   2016-11-06 02:35:00
遇到经验外的事件 人类跟电脑都一样只能用猜的
作者: arrenwu (键盘的战鬼)   2016-11-06 02:35:00
是啊,可以说是经验啊,所以放招有可能取得很大成果但要看一个策略好不好,要看打几千场下来的结果
作者: Heeida (....)   2016-11-06 02:35:00
围棋是轮流,算出可能性还有对应时间,星海错了大势已去
作者: Sischill (Believe or not)   2016-11-06 02:36:00
你讲的情形不管人脑电脑差别到底在哪? 遇到那种赌招的人脑一样会跟电脑错乱呀
作者: Heeida (....)   2016-11-06 02:36:00
的情况比较多吧,能屌打人类就表示电脑学会人的狡滑了..
作者: twosheep0603 (两羊)   2016-11-06 02:36:00
电脑比人类强的优势之一就是左右互搏几千场是可能的也就是说所谓奇招对电脑来说可能也看过数百次
作者: kinghtt (万年潜水伕)   2016-11-06 02:37:00
阿法狗上场前有自机对奕上千场累积经验强化分支选择
作者: twosheep0603 (两羊)   2016-11-06 02:38:00
至于电脑学会狡猾 也要看狡猾能不能帮助它赢
作者: kinghtt (万年潜水伕)   2016-11-06 02:39:00
所以对人类时阿法狗会下胜率最高的步数而不是暴力破解
作者: twosheep0603 (两羊)   2016-11-06 02:39:00
总觉得原PO过分强调围棋回合制与星海即时的差异了
作者: Heeida (....)   2016-11-06 02:40:00
光学会狡猾这件事在AI就是大突破了,这篇的主旨也是这吧..
作者: arrenwu (键盘的战鬼)   2016-11-06 02:40:00
战争只有一次,但是星海可以打1000场啊
作者: kinghtt (万年潜水伕)   2016-11-06 02:40:00
李世石比赛之后的对奕也学阿发狗走精算过的步数减少
作者: Heeida (....)   2016-11-06 02:41:00
围棋得到的情报是100%正确的,能判断假情报就比围棋价值高
作者: kinghtt (万年潜水伕)   2016-11-06 02:41:00
直觉式的下法…他也因此提高胜率
作者: arrenwu (键盘的战鬼)   2016-11-06 02:41:00
你讲的没办法预测对手放招,这不分人脑or电脑的
作者: twosheep0603 (两羊)   2016-11-06 02:42:00
应该说是测验对于不完全的资讯计算的能力吧
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:42:00
我指的是电脑要怎么"思考"的算法,之前工作上有接触过
作者: Sischill (Believe or not)   2016-11-06 02:42:00
我觉得讨论已经偏了 重点是人脑跟电脑的差异
作者: kinghtt (万年潜水伕)   2016-11-06 02:43:00
阿法狗对人类最大的教育就是直觉非最嘉选择…
作者: twosheep0603 (两羊)   2016-11-06 02:43:00
另外电脑对于胜率高的概念跟人类绝对不一样
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:43:00
自然语言学习的工具,它学习的过程并不是人去教他文法是
作者: arrenwu (键盘的战鬼)   2016-11-06 02:43:00
预测对面会不会放招这不可能吧...根本没有前兆啊
作者: Sischill (Believe or not)   2016-11-06 02:43:00
首先你说计中计中计中计, 电脑AI在学习时所有的replay都
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:44:00
什么,它会自己找一套方法,但是怎么"学习"还是有算法
作者: kinghtt (万年潜水伕)   2016-11-06 02:44:00
精算过的走法才是获胜的最佳解
作者: arrenwu (键盘的战鬼)   2016-11-06 02:44:00
他只要胜率比人类高,他就超越人类了
作者: Sischill (Believe or not)   2016-11-06 02:45:00
可以记录下来 人脑不行, 那在策略上 人脑除非用电脑没
作者: twosheep0603 (两羊)   2016-11-06 02:45:00
实际上它不需要100%碾压也能体现价值
作者: arrenwu (键盘的战鬼)   2016-11-06 02:45:00
说穿了AI根本没有所谓的“想到你要怎么做”这种概念
作者: Sischill (Believe or not)   2016-11-06 02:46:00
人脑也是一样的下场 所以跟本上来说人脑在RTS就没有什么
作者: kinghtt (万年潜水伕)   2016-11-06 02:46:00
另外,胜率最高的步数代表输的场次最少…
作者: jmss50894 (加味逍遥散)   2016-11-06 02:47:00
预测敌方单位从初始时间开始加机率像三路英雄消失没视野 大概要进巴龙池
作者: w60904max (自宅警备队员)   2016-11-06 02:49:00
结果是躲在草丛 准备BD主堡 XD
作者: kinghtt (万年潜水伕)   2016-11-06 02:50:00
其实是起内哄都龟温泉放烂
作者: twosheep0603 (两羊)   2016-11-06 02:50:00
那准备BD主堡的机率价值函数也会上升
作者: w60904max (自宅警备队员)   2016-11-06 02:51:00
但探巴龙的胜率比较高 所以还是选了这步
作者: CactusFlower (仙人掌花)   2016-11-06 02:53:00
可是深度思考恐怖的地方就在于他学习的能力啊...
作者: arthurduh1 (arthurduh1)   2016-11-06 02:53:00
不会因为胜率高就固定选哪一步阿
作者: bndan (seed)   2016-11-06 02:53:00
还有一个点是原文有提的 就是"即时" 如果真让AI在人类社会
作者: bndan (seed)   2016-11-06 02:54:00
更有贡献 那这AI必须要能处理"即时"的事件
作者: twosheep0603 (两羊)   2016-11-06 02:54:00
以刚刚那个探巴龙vs守家防BD的例子来说AI会在两者各给出一个机率 然后靠机率做决策
作者: arrenwu (键盘的战鬼)   2016-11-06 02:55:00
DeepLearning厉害是厉害在资料够多一定会optimal
作者: twosheep0603 (两羊)   2016-11-06 02:56:00
但不是哪边机率最高就选哪边 是机率高的容易被选中
作者: w60904max (自宅警备队员)   2016-11-06 02:56:00
对 不过这点就跟DL无关了
作者: kmchao33 (有點累)   2016-11-06 03:22:00
比星海是要比加速好吗
作者: Murasaki0110 (麦当劳欢乐送)   2016-11-06 03:28:00
别神话DL好吗...解不好的问题还一堆SGD一定会optimal大家也不用tune半天参数了
作者: KenWang42 (KenWang42)   2016-11-06 03:49:00
这个时代 人人都能嘴出一套算法
作者: Khadgar (Khadgar)   2016-11-06 04:39:00
这样星海算是NP问题吗?
作者: HappyKH (KH)   2016-11-06 05:52:00
想到阿法狗的未来是战争用途总觉得毛毛的
作者: hsiehhsing (海谐会会员)   2016-11-06 06:27:00
总算有非单细胞的人了,阿法狗要突破的就是预测的障碍而不是单单的运算胜率结果一堆人只看操作,但没思考光有操作能赢比赛吗
作者: max199083 (阿盟)   2016-11-06 06:34:00
不用太高估星海的决策复杂度
作者: ultratimes   2016-11-06 07:00:00
电脑光散兵,人根本散不赢 人类只能一小坨拉开
作者: lugiam (Anashisu)   2016-11-06 07:26:00
在生物界 最狡猾的就是人类 无人能出其右
作者: hsiehhsing (海谐会会员)   2016-11-06 07:36:00
捧那么高,明年去挑战阿法狗阿,bz会放APIDeepMind 在 APM 上将有所限制,确保双方的对战是公平google团队都已经声明了,呵呵 不知道在捧阿法狗的人有什么想法
作者: hyk32166 (了了了)   2016-11-06 08:13:00
觉得有操作就能赢应该没玩过吧XD
作者: w3160828 (kk)   2016-11-06 08:22:00
讲的好像有微操 阿法狗靠工兵能吃掉整团兵
作者: orze04 (orz)   2016-11-06 08:26:00
看过年初那篇论文 星海你要怎得到value network?
作者: satheni (看到羊就想睡..)   2016-11-06 08:31:00
电脑的算法会有一个判定哪个做法效益值最高的解但是星海2你要如何判定这个解,考验的不只是电脑,还有工程师,而且那个微操基本上跟开挂没两样就别提了
作者: kira925 (1 2 3 4 疾风炭)   2016-11-06 08:34:00
你看到那些微操 其实都是作弊的
作者: satheni (看到羊就想睡..)   2016-11-06 08:34:00
如果不是取得内部资料,怎么可能精准算出距离多少
作者: kullan (Welcome to Hentai-wan)   2016-11-06 09:04:00
在太多未知的条件下 电脑要赢星海电竞选手难度远比围棋高如果比的都是200人口对战 那当然不可能赢AI
作者: brianzzy (BK)   2016-11-06 09:15:00
这让我想到尼特罗会长在自爆前对蚁王说 别小看人类的恶意
作者: ColdLeafOwl (冷叶鸮)   2016-11-06 09:19:00
个人觉得避免使用"狡猾"这种词来形容AI比较适当毕竟是不同的东西 过于直觉地尝试理解可能会认知偏差关于选择胜率高的作法也值得讨论单纯这么做的话 搭配的即时资讯判读 会不会反而什么都没做到? 也就是没有一套有明确目的的战术这个还请有完星海的版友解惑了 小弟没有真正接触过
作者: icerany   2016-11-06 09:45:00
回楼上,玩家在打星海时也是靠探查到的情报下去做应对但这情报不一定是真的,有可能是对方的骗局
作者: smart0eddie (smart0eddie)   2016-11-06 09:46:00
微操微操微操 没指令哪来微操
作者: icerany   2016-11-06 09:47:00
你选则胜率高的战术也是人之常情
作者: smart0eddie (smart0eddie)   2016-11-06 09:47:00
围棋回合制时间都不够烧 即时制来的及下整体战术?
作者: Mchord (Mchord)   2016-11-06 09:52:00
个人心得,DL是因为一些算法使得大型NLP模型的参数可求
作者: A1pha ([αλφα])   2016-11-06 09:53:00
推推
作者: Mchord (Mchord)   2016-11-06 09:53:00
解吧,觉得不用设计算法,或AI懂"学习"甚至不用数学都有点太过于商业宣传了input现在有机会透过数学模型对应到抽象的output才是真的
作者: linzero (【林】)   2016-11-06 09:58:00
可是电脑可以打防守拼微操,敌人打来以微操来用低耗损来换单位。所以也不太需要战术,用一定模式生产单位即可。
作者: kira925 (1 2 3 4 疾风炭)   2016-11-06 09:59:00
BW的话是这样 SC2的操作差距有限
作者: linzero (【林】)   2016-11-06 10:04:00
因阿法狗的机制好像是随机行动,留下胜率高的行为,再以这范围继续随机,一直重复取得胜率高的模式。学习当中遇到各种战术,最终应该是会以其微操优势为核心发展出应对机制。所以有可能初期是以多路单兵骚扰为辅发展自身为主到后期兵够了一整波海过去。或者是初期就拼微操打快攻
作者: tsubasawolfy (悠久の翼)   2016-11-06 10:10:00
Deepmind是要训练战争策略。想想真实世界战争资源都量化,配上美军正在发展的无人攻击机跟无人舰。以后局部战争谁要跟他打。
作者: penut85420 (PenutGGorz)   2016-11-06 10:15:00
终于有理智人出来说话了
作者: MoMovincent (MoMoTea)   2016-11-06 10:53:00
教主:侦查?开天眼通就好了阿
作者: awfulday (糟糕的一天 樱雨绵绵)   2016-11-06 11:04:00
还有人在玩sc喔??
作者: alankira (小艾)   2016-11-06 11:11:00
...本文不错,但你后面的论点我觉得有点流于情感阐述了
作者: shinwind (风)   2016-11-06 11:43:00
其实我一直觉得 到底有多少人有资讯背景然后可以轻松说出电脑必胜可能在未来的某一天是这样没错!但是打星海这件事情 有太多因素同时在判断没错 对于人类来说确实很简单.但是放到电脑的领域根本完全不一样更何况是非常即时的运算!我意思是几分钟内出现的大量可能性
继续阅读
[闲聊] 一觉醒来发现蝙蝠侠和超人互换身体会如何than09138[问题] 智乃都是怎么尿尿的?cpblgu[16秋] 长骑美眉04sleepmageRe: [新闻] 暴雪结合DeepMind人工智能 开发星海争霸2dulinoveRe: [新闻] 暴雪结合DeepMind人工智能 开发星海争霸2NerVGearRe: [问题] 像白箱这样边播边画正常吗?Xavy[创作] 你的名字观后感furato[开箱] 枪弹辩驳3BDII(全系列雷)kingbalanceRe: [[email protected]

Links booklink

Contact Us: admin [ a t ] ucptt.com