情报来源:https://cnet.co/2YwIZUo
Google的DeepMind正透过星海争霸II来帮助他们训练自动驾驶车辆
在这个时代里,寻找新的方式来训练神经网络已经越来越重要,尤其在许多厂商开始自动
驾驶车辆开发竞赛。因此,有些开发者试图发明崭新的训练方式来提升他们的神经网络训
练效率,使用《星海争霸II》就是其中之一。
你可能会想,一款近十年的老游戏怎么可能和最先进的神经网络沾上边?那你就错了。根
据麻省理工科技评论在周四的报导(https://bit.ly/32UQ9RX),让游戏中AI更强大且难
以被击败的技术和神经网络开发有些雷同。
在《星海争霸II》中,玩家要一次控制数十个不同的单位,他们各有不同的能力,同时也
要在精准掌控资源的情况下与对手决战并获得胜利。对于人类来说,这样复杂的思考并不
是太过困难,然而对于电脑而言可没那么简单。这是不是和开车相似呢?
Google DeepMind 系统使用一种被称为PBT(population-based training)的算法来让
AI复制学习。这一套算法让AI得以从最有效率的单位开始学起,以此为基础进行延伸。
这套模式同样发生在自动驾驶训练上。DeepMind挑选出最佳的神经网络,在有新数据加入
时再训练或调整目前的状态。
Waymo(Google旗下的自驾车公司)基本机器学习建设总监在接受麻省理工科技评论的采访
时表示:“在产业上的机器学习面临最主要的一个挑战即是能够建立一个有利于新代码加
入的系统。我们要不断的训练并重新编写代码,而当你重复训练时,常常要调整参数。”
Google已经把他们一部分的机器学习科技给商业化,但它在 Waymo 的自驾车学习上特别应
用了PBT算法,这已经被全世界认为是最先进的自驾车系统并进行过上亿公里的模拟路程
。