[新闻] DeepMind AI与人类合作玩夺旗策略游戏， skyhawkptt PTT批踢踢实业坊

[新闻] DeepMind AI与人类合作玩夺旗策略游戏，

楼主: skyhawkptt (skyhawk) 2019-06-02 00:47:01

DeepMind AI与人类合作玩夺旗策略游戏，表现与人类玩家相当
https://is.gd/Bt8fO6
DeepMind用强化学习训练AI玩家，在复杂多人连线3D游戏中的夺旗竞赛场景，AI玩家的表
现已达人类水准
DeepMind最近发表用强化学习训练AI模型的新进展，在复杂多人连线3D游戏《雷神之锤
III竞技场》中的夺旗竞赛场景，AI玩家的表现已达人类水准，能够成功地与人类玩家合
作，不仅如此，该AI模型的研究成果，也可以扩展到《雷神之锤III竞技场》完整的游戏
场景中，该研究显示多代理人（multi-agent）训练在AI领域开发上的潜力。
这个研究的目标是多代理人学习，也就是每个个别的代理人都必须独立行动，并学会与其
他代理人互动和合作，DeepMind指出，地球上有数十亿的人居住，每个人都有自己的目标
和活动，但是仍然可以透过团体组织和社会聚集在一起，展现出集体智慧，这就是
DeepMind期望AI玩家能学会的能力，不过，这也是一个非常困难的任务，因为环境一直在
改变。
为了研究这道难题，DeepMind利用3D第一视角的多人连线游戏，来训练AI模型，这些游戏
能够代表最受欢迎的游戏种类，并且也因为沉浸式的游戏方式，可以收集到数百万游戏玩
家的想像，也能使AI学习到策略、技巧、手眼协调和团队合作，对AI玩家来说，挑战是要
直接从原始的像素资料直接学习，并产生动作，这样的复杂度也使得第一视角的多人连线
游戏，成为丰富的AI训练资源。
首先，DeepMind训练AI玩家学习像其他玩家一样行动，而且要学会与同队的玩家合作，不
管是AI或是人类玩家，夺旗竞赛的规则很简单，但是动态的变化却很复杂，两个队伍各自
的玩家要在给定的地图上，抢夺对方队伍的旗帜带回自己的基地，同时又要保护自己队伍
的旗帜，若点击持有自己队伍旗帜的敌对玩家，就能将旗帜送回原本的基地，在5分钟内
拥有最多旗帜的队伍即获胜。
从游戏AI玩家的角度来看，夺旗竞赛需要玩家与团队合作一起对抗敌人，为了让研究变得
更有趣，DeepMind为夺旗竞赛增添了一些变量，每个竞赛中的地图配置都不相同，如此一
来，AI玩家就被迫要找出通用的策略，而不是靠着记忆地图来完成任务，除此之外，为了
确保竞争环境公平，AI玩家和人类玩家是用类似的方式玩夺旗游戏，AI玩家观察像素图像
的串流资料，并透过模拟游戏控制器来产生执行动作。
DeepMind所用的强化学习有3大概念，第一，DeepMind训练了一群AI玩家，而不是只有一
个，因此，AI之间可以互相学习，提供多元的队友或是敌人，第二，每个AI玩家都会学习
自己的内部奖励讯号，使得AI产生自己的内部目标，像是抢夺旗帜，第三，AI玩家执行游
戏的时间区段的分为快和慢两种，来改善AI使用内存和产生一致行动序列的能力。

作者: modelfucker (喂，礼安) 2019-06-02 00:52:00

想到以前nike的那个广告..

作者: ksjr (kjsr) 2019-06-02 01:09:00

以后cs外挂四个ai队友XD

作者: DendiQ (貔貅) 2019-06-02 02:08:00

OpenAI 我记得也有开放人类跟电脑合作Dota2

作者: lordlpg (M) 2019-06-02 03:08:00

Quake Champions 的 AI 也不错喔

作者: bang71013 (贫乳哥布林) 2019-06-02 12:26:00

ai不就是作弊

作者: star123 (光二比利海灵顿) 2019-06-02 12:53:00

不是

作者: Nravir 2019-06-02 12:55:00

AI 和外挂还是有差

作者: lovinlover (Lovin Lover) 2019-06-02 13:53:00

作弊有两种一种是无失误人类有可能办到一种是不可能

作者: eljin (Genius) 2019-06-02 22:34:00

AI是直接存取游戏系统还是透过摄像头和机械手臂操作键鼠？

作者: jim8596 (休刊是童年的回忆) 2019-06-02 23:11:00

你可以看星海的deepmind 基本上就是让ai用程式操作类似于人用键盘鼠标只是ai猛在即使限制手速操作依然非常精准

作者: artyman (another arty) 2019-06-03 02:55:00

AI 跟人类比赛根本没什么意义运作机制大不同

作者: kafai (猪仔包 PigSonBow) 2019-06-03 09:51:00

AlphaStar嬴那10场就算是作弊，它是直接获得整张地图讯息后来输掉那场是自己控制视角，自己按指令，没有用AI 接口

继续阅读

Fw: [闲聊] 那个天命奇御的剧情....wizardfizban Fw: [情报] Minecraft故事模式停止支援kylefan Fw: [情报] 2D动作游戏的极致!纯白钢铁的X evan142536 [闲聊] 全军三国这版吕布是不是做坏了?sentmental [实况]【千森】层层恐惧2kazushige [限免] Glorkian Warrior: The Trials Of Glorkalanalg [问题] 河洛群侠传优化问题SACyuki [问题] 有推荐的副厂手把吗bluecube000 [新闻] 苍蓝雷霆新作《银白钢铁 X》将登上Steamdickec35 [心得] 三国资本论-深刻揭露资本社会土地兼并a1e