https://goo.gl/A7eHXU
苹果 2017年10月19日11:34 国际中心/综合外电报导
Google旗下Deepmind团队开发的人工智能AlphaGo,之前的版本分别在击败韩国棋王李世?
、中国棋王柯洁后相继退役,但DeepMind仍继续研发,时隔5个月又发表更进化的AlphaGo
Zero。AlphaGo Zero未使用任何人类棋谱,从零开始学习围棋规则,短短3天内就以自创
招数,胜过人类3000年来累积的围棋智慧,更成为打败前代AlphaGo的顶级高手。
Deepmind团队在科学杂志《自然》发表论文,称过去的AlphaGo都结合数百万份人类围棋
高手的棋谱自我学习,但最新的AlphaGo Zero未用到任何人类围棋数据,凭借更新后的
神经网络和算法,依据围棋规则和自己下了500万盘棋后,迅速进步,“不仅重新发现
人类倾向使用的开局走法与招式……之后还扬弃了这些走法,自创出过去人类根本不知道
的招式。”
论文中指出,AlphaGo Zero自学3天后,就以100:0打败在2016年3月战胜李世?的旧版
AlphaGo;自学40天后,又击败今年5月战胜柯洁的AlphaGo Master。
AlphaGo团队负责人大卫席尔瓦(Dave Sliver)指出,AlphaGo Zero使用新的强化学习方
法,让自己变成老师。系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,
透过神经网络强大的搜索算法,进行自我对弈。随?自我博弈的增加,神经网络逐渐调整,
提升预测下一步的能力,最终赢得比赛。
席尔瓦说,大家都以为,人工智能只和大数据与大量资料的演算有关,但AlphaGo Zero证
明,算法才是王道。 (国际中心/综合外电报导)