[FB] 黄士杰 11/10人工智能年会介绍AlphaGo Zero 开发过程

楼主: jkkert   2017-10-20 10:55:59
FB卦点说明:(繁体中文 20 个字)
黄博士:
11月10日在人工智能年会的演讲,我也将介绍AlphaGo Zero的精彩故事。
(中略......)
AlphaGo Zero对战Master达到近90%胜率,
成为有史以来AlphaGo棋力最强的版本。
FB连结:
https://goo.gl/kDKy99
FB内容:
大家好,我们很高兴与大家分享AlphaGo的第2篇论文,非常荣幸AlphaGo团队再次登上了
世界顶尖的《自然》杂志。
11月10日在人工智能年会的演讲,我也将介绍AlphaGo Zero的精彩故事。
这篇论文介绍了AlphaGo Zero,也就是完全脱离人类知识的AlphaGo版本。主要成果如下

- AlphaGo Zero从零开始自我学习下围棋。
- 仅仅36小时后,AlphaGo Zero靠着自我学习,就摸索出所有基本且重要的围棋知识,达
到了与李世石九段对战的AlphaGo v18的相同水平。
- 3天后,AlphaGo Zero对战AlphaGo v18达到100%的胜率。
- 不断进步的AlphaGo Zero达到了Master的水平。Master即年初在网络上达成60连胜的
AlphaGo版本。
- 40天后,AlphaGo Zero对战Master达到近90%胜率,成为有史以来AlphaGo棋力最强的版
本。
虽然AlphaGo Zero没有公开下过棋,
在论文中我们附上了AlphaGo Zero的80局棋
(选自不同阶段的自我学习,https://goo.gl/Q7nUHS ),
供大家研究。
从围棋技术的角度来说,AlphaGo Zero自学所发现的围棋观念,例如打劫、征子、棋形、
开局先下在角部,开局定式等等,绝大部分与人类的围棋观念是一致的,这也间接呼应了
人类几千年以来围棋研究的价值。
AlphaGo Zero的棋风特别好战,并且也喜欢直接点33。
从论文内容来说,这主要是一篇强化学习的论文,关键技术在于强化学习训练pipeline的
效能极大化。
针对这篇论文或AlphaGo想要提问的朋友,请参加明天的AlphaGo AMA,AlphaGo团队的
David Silver与Julian Schrittwieser将在线以英文回答大家的问题。
https://goo.gl/Vo2qoZ
※ 脸书爆卦请用FB当标题,并附上20繁体中文说明卦点,违者水桶一个月。
※ 注意!滥用FB爆卦视同闹板文处理。
※ 记得要附上来源网址。
作者: snowrain (无心之偿有心兹勤)   2017-10-20 10:57:00
土条核废料放你家(大误)
作者: chadmu (查德姆)   2017-10-20 10:58:00
分类啦
作者: abc0922001 (中士abc)   2017-10-20 10:58:00
对战Master到90%,是怎样...
作者: obdv (真☆母★教右护法)   2017-10-20 11:00:00
马的SAI又进化啦
作者: SnakeO (ha)   2017-10-20 11:02:00
输的10%是之前摸索阶段输的吗@@?
作者: fire124 (Jack The Ripper)   2017-10-20 11:03:00
只是宅男,别怕
作者: goldduck (哥达鸭)   2017-10-20 11:04:00
在过几天 100%
作者: scott0002 (sc)   2017-10-20 11:10:00
3天人类累积的所有围棋知识被从0创造 可见未来进步会有的喔快速
作者: ECZEMA (加油!)   2017-10-20 11:18:00
AI 学东西特别快 应该可以在数学上作大突破
作者: aaaba (小强)   2017-10-20 11:24:00
op
作者: schumi7401 (死蚊子给我出来)   2017-10-20 11:32:00
Master人类就赢不了了zero还屌打 那人类还玩个屁
作者: goldduck (哥达鸭)   2017-10-20 11:35:00
早就是低等生物了
作者: moonlind (又多了敷脸卡跟觅食卡了~)   2017-10-20 11:47:00
AI神奇的地方就在这里 例如看一个人的脸就能知道他的星座 说不定都办得到 问题是人根本不知道他如何办到

Links booklink

Contact Us: admin [ a t ] ucptt.com