原文标题:OpenAI训练电脑看影片玩《Minecraft》 做钻石镐的速度竟比人类还快
原文网址:https://game.udn.com/game/story/122089/6421693
游戏角落 溺水的海藻
https://uc.udn.com.tw/photo/2022/06/28/0/17820155.png
图/OpenAI
微软旗下 Mojang Studios 开发的工艺沙盒游戏《Minecraft》,以几乎没有边界限制的
多生态域世界,让玩家随意与环境方块互动、创作各种事物,2011 年发售持续更新各种
内容,至今仍受到大家喜爱,但如今就连 AI(人工智能)都学会在游戏中建设自己的家
园了。
https://uc.udn.com.tw/photo/2022/06/28/0/17820062.png
OpenAI 是一个非营利的人工智能研究组织,由SpaceX 暨特斯拉执行长伊隆·马斯克(
Elon Musk)于 2015 年创立,近日他们在官方 Twitter 上透露,在给 AI 看了约 7 万
小时(换算约 8 年)的 YouTube 影片后,AI 即能上手《Minecraft》。
https://uc.udn.com.tw/photo/2022/06/28/0/17820052.jpg
| We trained a neural network to competently play Minecraft by pre-training on
| a large unlabeled video dataset of human Minecraft play and a small amount
| of labeled contractor data. https://openai.com/blog/vpt/
(影片)https://twitter.com/OpenAI/status/1540032456559955968
另根据记录在官方部落格的训练过程,OpenAI 采用了一种叫影像预训练(Video
PreTraining: VPT)的技术,来教导 AI 游玩《Minecraft》,电脑要学习的不只是影片
的内容,还包括对应的键盘及鼠标操作。
https://uc.udn.com.tw/photo/2022/06/28/0/17820053.jpg
接着他们训练一个逆动力模组(inverse dynamics model)去预测影片中的每一个操作会
造成什么结果,然后让 AI 根据资料建构一个基础模型,并微调及学习新的动作。
https://uc.udn.com.tw/photo/2022/06/28/0/17820056.jpg
最终,这个模型在看了上万小时的影片后,学会影片中的动作,如砍树、用木材制作工作
台。这当然不是全部,模型也能做到像游泳、打猎、进食等较困难的操作,甚至还能做到
“跳叠”利用跳跃的瞬间把方块快速放置在脚下到达高处。
https://uc.udn.com.tw/photo/2022/06/28/0/17820051.jpg
其中砍树、收集原木、将原木制作成木板,然后将木板制作成工作台的过程,AI 只花约
48 秒;这个过程需要一个精通《Minecraft》的人类大约 50 秒或 1,000 个连续的游戏
动作。
https://uc.udn.com.tw/photo/2022/06/28/0/17820054.jpg
AI 的能力也会随着看影片的时间加长而增长,如制作能力的提升,从木头、石头发展到
挖掘钻石制作工具,就连建房子、搜索村庄也可以。
https://uc.udn.com.tw/photo/2022/06/28/0/17820108.jpg
研究人员为了激发 AI“强化学习”,会在成功完成困难的挑战时给予奖励,以促成超人
类的游戏表现,比如做出钻石镐,这是首度有电脑在《Minecraft》做出如此创举,在 10
分钟的游玩过程中有 2.5% 机率会这么做,而人类必须花 20分钟、24,000 次才能做到
。
玩游戏已经不是人类的特权了。不仅是像《Minecraft》这样的沙盒游戏,也许未来我们
还会看到更多 AI 游戏应用,比如 2018 年 OpenAI 被训练来对抗《Dota 2》并打爆职业
玩家,抑或《Ready or Not》让 AI 学会上厕所、欣赏画作跟抽菸。
https://youtu.be/LVrpWrvHVNE
参考资料:https://www.itmedia.co.jp/news/articles/2206/28/news067.html