※ [本文转录自 Gossiping 看板 #1Pw3U84F ]
作者: SangoDragon (SANGO) 看板: Gossiping
标题: [FB] 黄士杰: 11月10日 人工智能年会的演讲
时间: Thu Oct 19 13:26:28 2017
FB卦点说明:黄士杰将在11月10日,人工智能年会的演讲
介绍AlphaGo Zero的精彩故事
FB连结: https://www.facebook.com/aja.huang
FB内容:
大家好,我们很高兴与大家分享AlphaGo的第2篇论文,非常荣幸AlphaGo团队再次登上了世
界顶尖的《自然》杂志。
11月10日在人工智能年会的演讲,我也将介绍AlphaGo Zero的精彩故事。
这篇论文介绍了AlphaGo Zero,也就是完全脱离人类知识的AlphaGo版本。主要成果如下:
- AlphaGo Zero从零开始自我学习下围棋。
- 仅仅36小时后,AlphaGo Zero靠着自我学习,就摸索出所有基本且重要的围棋知识,达到
了与李世石九段对战的AlphaGo v18的相同水平。
- 3天后,AlphaGo Zero对战AlphaGo v18达到100%的胜率。
- 不断进步的AlphaGo Zero达到了Master的水平。Master即年初在网络上达成60连胜的
AlphaGo版本。
- 40天后,AlphaGo Zero对战Master达到近90%胜率,成为有史以来AlphaGo棋力最强的版本
虽然AlphaGo Zero没有公开下过棋,在论文中我们附上了AlphaGo Zero的80局棋(选自不同
阶段的自我学习,
https://www.nature.com/…/v5…/n7676/extref/nature24270-s2.zip),供大家研究。从
围棋技术的角度来说,AlphaGo Zero自学所发现的围棋观念,例如打劫、征子、棋形、开局
先下在角部,开局定式等等,绝大部分与人类的围棋观念是一致的,这也间接呼应了人类几
千年以来围棋研究的价值。AlphaGo Zero的棋风特别好战,并且也喜欢直接点33。从论文内
容来说,这主要是一篇强化学习的论文,关键技术在于强化学习训练pipeline的效能极大化
。
针对这篇论文或AlphaGo想要提问的朋友,请参加明天的AlphaGo AMA,AlphaGo团队的
David Silver与Julian Schrittwieser将在线以英文回答大家的问题。
https://www.reddit.com/…/ama_we_are_david_silver_and_julia…/
时间是 10月19号英国时间晚上6点 (台湾时间 10月20日凌晨一点)