1.媒体来源:
联合
2.记者署名:
杨又肇
3.完整新闻标题:
DeepMind打造会自主学习新规则的人工智能MuZero
4.完整新闻内文:
Alphabet旗下人工智能技术公司DeepMind,宣布推出名为MuZero的人工智能系统,标榜在
完全不了解规则情况下,即可快速熟悉围棋、西洋棋、将棋,或是57款Atari电子游戏游
玩规则,并且取得更好游玩表现。
依照DeepMind说明,MuZero的技术背后,代表可借由人工智能技术也觉日常生活中复杂规
则,或是事前无法确知规则的难题。
相比现有DQN、R2D2或Agent57人工智能技术,MuZero能以更快效率找出既有规则,并且快
速解决问题。而MuZero的技术更代表能让人工智能有规划思考能力,并且利用现有条件统
整规则,即便面临全新运算场景也能快速找出问题解决方式。
过去研究人员分别透过预先搜寻 (lookahead search),以及基于现有运算模型规划能力
,让人工智能能针对未知规则情况进行运算,但由于既有运算方式仍仰赖前期规则训练,
因此必须花费更多时间才能顺利找出全新运算环境对应规则,因此并不适合用于解决未知
条件的运算需求,同时也难以解决条件相对复杂的运算情境。
因此DeepMind在MuZero技术采用不同作法,而是让人工智能可依照当前蒐集资讯进行分析
学习,借此缩短在变动条件环境运算所需时间,其中包含当前决策价值、最佳运算决策,
以及前一个决策执行成果,借此进行反复学习,进而从中学习最佳规则执行决策能力。
在这样的运算模型执行下,将可让MuZero人工智能技术在围棋、西洋棋、将棋,或是57款
Atari电子游戏更快发挥执行效果,甚至在棋艺能力比拟AlphaZero,并且在Atari电子游
戏执行成果更胜现有人工智能技术。
同时,若允许MuZero以更长时间进行“思考”,其在棋艺表现会有更显著下子正确率,并
且呈现更精湛的进攻方式,甚至可在电子游戏内容有更高学习效率。
未来DeepMind团队预计利用MuZero技术解决更多人工智能前期学习与分析未知解法问题,
预期未来也能让更多机器人、自驾车等经常处于未知判断条件的运算需求,能在更短时间
内找到合适执行方式。
5.完整新闻连结 (或短网址):
https://udn.com/news/story/7086/5120425
6.备注: