[新闻] AlphaGo成功关键 黄士杰:策略结合值网络

楼主: amix (^^)   2016-03-18 23:42:58
AlphaGo成功关键 黄士杰:策略结合值网络
http://i.epochtimes.com/assets/uploads/2016/03/1603181042202544.jpg
黄士杰解说机器学习如何让AlphaGo自我学习。(陈懿胜/大纪元)
【大纪元2016年03月18日讯】(大纪元记者陈懿胜台湾台北报导)谷歌(
Google)旗下DeepMind开发的人工智能系统“AlphaGo”,日前以4:1大胜韩
国九段围棋高手、世界冠军李世石。AlphaGo主要开发者、来自台湾的黄志杰
18日返台及分享经验,他表示,AlphaGo成功的主要关键在于策略网络(
Policy Network)与值网络(Value Network)的分析方式,让它能在20~30
万份对战棋谱中,找出最好的20步,才能够在此世纪之战中获胜。
黄志杰指出,围棋第一步的下法选择就高达361种,变化数有10的364次方,
对早期人工智能来说,根本无法计算。但对AlphaGo来说,运用策略网络来减
少搜寻广度,从360步只要找到20步;价值网络则是直接判断盘面状况,了解
优势还是劣势,减少搜索深度,自然会提升胜率。
对于第四局对战AlphaGo落败,黄志杰说,当时李世石下了神之一手,以致值
网络发生误判,接连处在劣势。由于AlphaGo会在比赛中随时计算胜率,如果
胜率低于20%就会投降,但为何会误判,目前仍不清楚详细原因。
黄志杰说,当AlphaGo通知投降时,他自己有笑了一下,因为他很尊敬李世石
,看过李世石大部分的棋谱与比赛,很荣幸能够坐在他对面。“我为李世石
高兴,因为知道他的压力很大,4比1是蛮圆满的结果。”
至于AlphaGo的未来发展,黄志杰表示,未来人工智能可望运用在医疗及机器
人上,并达到预先诊断、找出病征,协助医学诊断。◇
新闻网址:http://www.epochtimes.com/b5/16/3/18/n4666018.htm
作者: devidevi (蜜蜜)   2016-03-19 09:19:00
结果1万个人有1个人出错,就被告不完了,这是现在医生的困境
作者: wadashi1 (阿拉丁)   2016-03-19 11:15:00
黄志杰是谁?
作者: gamania10000 (自助旅行中)   2016-03-19 11:58:00
球给
作者: NCUking (中大王)   2016-03-19 19:54:00
连名字都写错 这记者…
作者: agario (Agar.io)   2016-03-20 09:31:00
其实这点大公司比个人医生有利,因为大公司可以买保险一万人才出错一次的话说不定保险就完全理赔完,根本不怕~

Links booklink

Contact Us: admin [ a t ] ucptt.com