Fw: [FB] 黄士杰: 11月10日 人工智能年会的演讲

楼主: staristic (ANSI lover)   2017-10-19 14:10:22
※ [本文转录自 Gossiping 看板 #1Pw3U84F ]
作者: SangoDragon (SANGO) 看板: Gossiping
标题: [FB] 黄士杰: 11月10日 人工智能年会的演讲
时间: Thu Oct 19 13:26:28 2017
FB卦点说明:黄士杰将在11月10日,人工智能年会的演讲
介绍AlphaGo Zero的精彩故事
FB连结: https://www.facebook.com/aja.huang
FB内容:
大家好,我们很高兴与大家分享AlphaGo的第2篇论文,非常荣幸AlphaGo团队再次登上了世
界顶尖的《自然》杂志。
11月10日在人工智能年会的演讲,我也将介绍AlphaGo Zero的精彩故事。
这篇论文介绍了AlphaGo Zero,也就是完全脱离人类知识的AlphaGo版本。主要成果如下:
- AlphaGo Zero从零开始自我学习下围棋。
- 仅仅36小时后,AlphaGo Zero靠着自我学习,就摸索出所有基本且重要的围棋知识,达到
了与李世石九段对战的AlphaGo v18的相同水平。
- 3天后,AlphaGo Zero对战AlphaGo v18达到100%的胜率。
- 不断进步的AlphaGo Zero达到了Master的水平。Master即年初在网络上达成60连胜的
AlphaGo版本。
- 40天后,AlphaGo Zero对战Master达到近90%胜率,成为有史以来AlphaGo棋力最强的版本
虽然AlphaGo Zero没有公开下过棋,在论文中我们附上了AlphaGo Zero的80局棋(选自不同
阶段的自我学习,
https://www.nature.com/…/v5…/n7676/extref/nature24270-s2.zip),供大家研究。从
围棋技术的角度来说,AlphaGo Zero自学所发现的围棋观念,例如打劫、征子、棋形、开局
先下在角部,开局定式等等,绝大部分与人类的围棋观念是一致的,这也间接呼应了人类几
千年以来围棋研究的价值。AlphaGo Zero的棋风特别好战,并且也喜欢直接点33。从论文内
容来说,这主要是一篇强化学习的论文,关键技术在于强化学习训练pipeline的效能极大化

针对这篇论文或AlphaGo想要提问的朋友,请参加明天的AlphaGo AMA,AlphaGo团队的
David Silver与Julian Schrittwieser将在线以英文回答大家的问题。
https://www.reddit.com/…/ama_we_are_david_silver_and_julia…/
时间是 10月19号英国时间晚上6点 (台湾时间 10月20日凌晨一点)
作者: cerberi (cerberi)   2016-10-19 13:28:00
强者的宿命 就是战呀
作者: soaping (捡肥皂ing)   2016-10-19 13:28:00
干 超神 只要告诉他游戏规则 就能发展出超猛战法
作者: aCCQ (阿贤)   2016-10-19 13:30:00
什么时候公开挑战即时战略游戏选手阿
作者: sampsonhugh (夏)   2016-10-19 13:31:00
对Google任建言请善用此信箱 https://goo.gl/dRTU4E
作者: aaaba (小强)   2016-10-19 13:49:00
楼主: staristic (ANSI lover)   2016-10-19 13:55:00
可以借转Go吗?
作者: zzzz8931 (肥宅)   2016-10-19 13:57:00
作者: shadow0326 (非议)   2016-10-19 14:00:00
好战AI的兴起,人类GG
作者: zeat (L.)   2017-10-19 14:29:00
无师自通也太强@@
作者: Yibooo ( )   2017-10-19 14:43:00
没受人类污染的版本 开局依旧下在很正常的地方没出现什么5-5、边星、天元之类的 人类应该感到很欣慰啊
楼主: staristic (ANSI lover)   2017-10-19 14:54:00
如果出现那种奇葩开局还能虐Master应该会更有趣XDDD
作者: s891234 (嘟噜咑)   2017-10-19 15:00:00
不知道无污染版本可不可能有原本没有的弱点><
作者: yys310 (有水当思无水之苦)   2017-10-19 15:04:00
好想听演讲...
作者: cubec (cubec)   2017-10-19 15:26:00
http://tinyurl.com/y8z2l6db AlphaGo Zero的80局对弈棋谱
作者: ddavid (谎言接线生)   2017-10-20 03:05:00
@s891234 理论上当然有可能,无人类棋谱并不代表它就不会落到某些局部最佳解,但是以学习速度来说人类还是难以抓到事实上它对于Master也没到100%胜率就证明了仍有可被Master抓到的缺点

Links booklink

Contact Us: admin [ a t ] ucptt.com