Open人工智能1v1胜Dota2最强玩家 将开启5v5模式
文章来源:机器之心
在 Dota2 一对一表演赛中,由 OpenAI 设计的 bot 打败了 Danylo “Dendi”
Ishutin,一名在职业生涯中已经赢得 735,449.40 美元奖金的职业玩家。OpenAI 的
bot 在第一场比赛开始约 10 分钟打败了 Dendi。在第二场比赛中 Dendi 放弃,并拒绝
进行第三场比赛。
在人机匹配赛之前,OpenAI CTO Greg Brockman 解释了该公司的特制 bot 接受了一
千次比赛的训练,训练由 OpenAI 进行指导。Brockman 还声称这个 bot 已经打败多个‘
Dota 2’职业玩家。
人工智能公司向来喜欢通过视频游戏测试其技术:DeepMind 选择了星际争霸 2,而
微软则在最近宣布要在 Ms。 Pac-Man 取得佳绩。Brockman 说,OpenAI 并不打算浅尝辄
止,而是希望其 bot 明年可在 Dota 5 对 5 游戏中作战。同时,OpenAI 将会发布该
bot,从而人人可以与其对决,并且举办方 Valve 将为击败该 bot 的第一个人类玩家提
供游戏币奖励。
以下是 OpenAI 官方博客对该比赛的介绍:
我们已创建了一个 bot,它在标准联赛规则下的 Dota 2 1 对 1 比赛中击败了人类
顶级职业玩家。该 bot 通过自学从头学习 Dota,但并没有使用模仿学习或树搜索。这向
构建在涉及真实人类的复杂环境中达成精确目标的人工智能系统迈出了前进的一步。
今天我们在国际赛的主赛场与 Dendi 对战,赢了一场三局两胜比赛。在过去一周中
,我们的 bot 在与许多顶级专业玩家,包括 SumaiL(世界 1v1 头号玩家)和 Arteezy
(世界头号全能玩家)对战时依然保持不败战绩。
Dota 1v1 是一个具备隐藏资讯的复杂游戏。智慧体必须学习规划、攻击、设局以及
欺骗对手。玩家技能和每分钟算子(actions-per-minute)之间的关联不是很强,事实
上,我们的 AI 的每分钟算子相当于人类玩家的平均水准。
在 Dota 中取胜需要玩家基于对对手的直觉而采取相应操作。在上面的视频中你可以看到
我们的 bot 已经习得了——完全通过自我对弈——预测其他玩家的下一步操作,在陌生
的环境中随机应变,以及通过对其他玩家的友军施加影响而帮助前者成功。
一场完整的 Dota 比赛包括两个战队,每队五人。每个玩家需要从一百个英雄和数百
种装备之间进行选择。我们下一步将创建一个可与人类战队竞争和合作的 Dota 2 bot 战
队。
http://sports.sina.com.cn/go/2017-08-12/doc-ifyixiar9935523.shtml