黄士杰返台分享AlphaGo Zero开发过程
生活中心/综合报导 2017-11-08 14:02
中央研究院今(8)日指出,谷歌电脑演绎人工智能(AI)系统AlphaGo的幕后推手黄士杰
,10日将在中研院演讲,和外界分享超越人类累积千年围棋智慧的AlphaGo Zero开发过程
。
中研院表示,由中研院资讯科学研究所与台湾资料科学协会共同主办的“2017台湾人工智
慧年会x 2017台湾资料科学年会”明天起一连4天将在中研院登场。
中研院表示,比较特别的是,今年台湾人工智能年会在10 日邀请谷歌电脑演绎人工智能
(AI)系统AlphaGo的幕后推手黄士杰,以“AlphaGo-深度学习与强化学习的胜利”为主
题,所做的演讲。
今年5月,Google旗下AI实验室DeepMind公司创造的AlphaGo,与围棋世界冠军柯洁在中国
乌镇对弈,结果以3:0胜出,人工智能的发展震惊全世界。不到半年,这个实验室又创造
出更强大的AlphaGo Zero,它完全不需要倚靠人类的知识和指导,从零开始自我训练,3
天时间就100:0打败旧版。
在过去,强大的人工智能得依靠人类事前输入大量资料,帮助它学习、训练技能,Alpha
Go成为围棋大师前也不例外。前不久,DeepMind公司在《自然》(Nature)科学期刊上发
表一篇学术论文〈不需要人类知识就称霸围棋〉(Mastering the game of Go without
human knowledge),展示了强化版的程式AlphaGo Zero,证明在全球最困难的棋艺竞技
中,人工智能可以在没有任何人类知识的基础上,纯粹靠自我学习成为制霸王者。
AlphaGo Zero代表从零开始,DeepMind开发团队只输入基本围棋规则,之后它会自行下棋
,并记录每次的胜负决策,不停学习,自己成为自己的老师,加上没有人类的经验和成规
束缚,让人工智能突破旧有的知识限制,发展出新的弈棋策略,达到登峰造极的境界。
DeepMind指出,他们不使用任何人类知识,AlphaGo Zero用上的是新的“强化学习”方法
,透过神经网络和算法结合,持续自我对弈练习几百万、几千万场,每次的更新都能增
强、调整系统,用以预测下一步落子的方向和游戏输赢走势。几天时间内,AlphaGo Zero
就从一块纯洁的白板,在上头不断挥洒、创造知识,很快胜过了人类累积千年的围棋智慧
。
黄士杰脸书介绍 AlphaGo Zero 的神奇表现:
1、AlphaGo Zero 从空白开始,完全只靠自学下围棋。
2、仅仅 36 小时,AlphaGo Zero 就摸索出所有基本且重要的围棋知识,达到了与李世
督B模밊