[新闻] 黄士杰返台分享AlphaGo Zero开发过程 qweewqq PTT批踢踢实业坊

[新闻] 黄士杰返台分享AlphaGo Zero开发过程

楼主: qweewqq (é¢¨ä¸€æ¨£çš„ç”·å) 2017-11-08 15:49:23

黄士杰返台分享AlphaGo Zero开发过程
生活中心／综合报导 2017-11-08 14:02
中央研究院今（8）日指出，谷歌电脑演绎人工智能（AI）系统AlphaGo的幕后推手黄士杰
，10日将在中研院演讲，和外界分享超越人类累积千年围棋智慧的AlphaGo Zero开发过程
。
中研院表示，由中研院资讯科学研究所与台湾资料科学协会共同主办的“2017台湾人工智
慧年会x 2017台湾资料科学年会”明天起一连4天将在中研院登场。
中研院表示，比较特别的是，今年台湾人工智能年会在10 日邀请谷歌电脑演绎人工智能
（AI）系统AlphaGo的幕后推手黄士杰，以“AlphaGo－深度学习与强化学习的胜利”为主
题，所做的演讲。
今年5月，Google旗下AI实验室DeepMind公司创造的AlphaGo，与围棋世界冠军柯洁在中国
乌镇对弈，结果以3：0胜出，人工智能的发展震惊全世界。不到半年，这个实验室又创造
出更强大的AlphaGo Zero，它完全不需要倚靠人类的知识和指导，从零开始自我训练，3
天时间就100：0打败旧版。
在过去，强大的人工智能得依靠人类事前输入大量资料，帮助它学习、训练技能，Alpha
Go成为围棋大师前也不例外。前不久，DeepMind公司在《自然》（Nature）科学期刊上发
表一篇学术论文〈不需要人类知识就称霸围棋〉（Mastering the game of Go without
human knowledge），展示了强化版的程式AlphaGo Zero，证明在全球最困难的棋艺竞技
中，人工智能可以在没有任何人类知识的基础上，纯粹靠自我学习成为制霸王者。
AlphaGo Zero代表从零开始，DeepMind开发团队只输入基本围棋规则，之后它会自行下棋
，并记录每次的胜负决策，不停学习，自己成为自己的老师，加上没有人类的经验和成规
束缚，让人工智能突破旧有的知识限制，发展出新的弈棋策略，达到登峰造极的境界。
DeepMind指出，他们不使用任何人类知识，AlphaGo Zero用上的是新的“强化学习”方法
，透过神经网络和算法结合，持续自我对弈练习几百万、几千万场，每次的更新都能增
强、调整系统，用以预测下一步落子的方向和游戏输赢走势。几天时间内，AlphaGo Zero
就从一块纯洁的白板，在上头不断挥洒、创造知识，很快胜过了人类累积千年的围棋智慧
。
黄士杰脸书介绍 AlphaGo Zero 的神奇表现：
1、AlphaGo Zero 从空白开始，完全只靠自学下围棋。
2、仅仅 36 小时，AlphaGo Zero 就摸索出所有基本且重要的围棋知识，达到了与李世
督B模꘵밊

继续阅读

[情报] 野狐出现神秘高手69连胜不败qweewqq [闲聊] 某安是不是自我感觉太过良好?rOck0913 [新闻] AlphaGo已经够聪明了? DeepMind：可以更远qweewqq [棋讯] [棋讯] 第22届三星杯世界围棋公开赛4强FAlin [新闻] 三星杯半决赛Ⅰ唐韦星负安国铉 qweewqq [转录]加藤英树谈围棋ＡＩ的过去．现在与未来(5)oldTim [转录]加藤英树谈围棋ＡＩ的过去．现在与未来(4)oldTim [转录]加藤英树谈围棋ＡＩ的过去．现在与未来(3)oldTim [新闻] 两岸大学生人机队际赛台湾大学生联队胜qweewqq Re: [讨论] alphago继续发展下去ddavid