[情报] 黄博士今日演讲内容 HeterCompute PTT批踢踢实业坊

[情报] 黄博士今日演讲内容

楼主: HeterCompute (异质运算) 2017-11-10 13:23:12

简单提一下今天黄博士演讲重点
演讲标题是深度学习与强化学习的胜利
认为zero是最佳的deepmind电脑围棋这部分最佳的收尾
黄博士对于一开始击败樊辉就发nature有些不解，我们要挑战李世石结果把所有技术都透漏给所有人，但deepmind的想法是我们需要分享技术让世界一起进步
google对alphago团队最大帮助是TPU
认为Master已经完美解决李世石第四盘的bug，解决方式与神经网络架构(dual res)和训练都有关，并且以他多年的电脑围棋经验与测试过后，认为不会再出现此类bug
Master是20block res-net，并改进了training pipeline和MCTS，也解决了模仿棋和循环劫(没说怎么做)，能让lee版本3子并超过50%胜率
master年初60连胜每一步4-8秒，在台湾，吃方便面配黑松沙士下的，是黄博士积极鼓吹要出来测试，Hassabis说要低调并使用韩国国籍，一开始不得透漏身分
Hassabis说要挑强的下，但是第一天职业没人愿意跟0胜0负的下，都被拒绝，等到第一天10连胜之后第二天开始拒绝别人邀请
master下的时候可以看胜率随步数的图，基本上50手之前斜率很高并且确立极大优势，唯一例外是柯洁乌镇第二盘
4月的时候已经有zero，但由于要发nature所以不能拿来下
当初开发zero没预料到会超过master
master年初开发完毕之后，zero由其他人负责开发，黄博士继续想方法增强master
zero不是放在那边增强学习就会变强，中间需要做很多优化，否则有bug不会进步，其中一个重大bug发生在第三天(纪录人表示：所以看来绝艺有得忙了
AntiAlphaGo，不是像大家想的那样有新的技术，就是左右互搏，也不是gan(生成式对抗网络)
master是否被人类棋谱拖累？答案是不确定，因为master训练时间较短，deepmimd也没有针对同等条件去比较。
以上，有其他疏漏请其他人补充，并欢迎转载，但请说明作者是Hetercompute

作者: staristic (ANSI lover) 2017-11-10 13:28:00

第三天？这么巧就是达到李世石版的那时候？

作者: CGary (下雨天也挺浪漫的) 2017-11-10 13:42:00

btw, AGZ 不会 open source.

作者: yys310 (有水当思无水之苦) 2017-11-10 14:11:00

呜呜好想听现场

作者: jackcselab (monk) 2017-11-10 15:12:00

这篇访问算是证实了DZG作者的猜想，master是用比较小的网络才输给zero，master跟zero在相同网络下并没有明显的优劣上面讲错，应该说master跟zero在相同条件下谁优谁劣还未知另外我有个疑问，记得当初有提到，master只计算到20步，这个20步跟resnet的20-block有关系吗?

作者: vencil (vencs) 2017-11-10 15:17:00

推

作者: yys310 (有水当思无水之苦) 2017-11-10 15:22:00

柯洁也真的是够神了

作者: CGary (下雨天也挺浪漫的) 2017-11-10 16:47:00

很难说是证实了其实Aja在被问的时候不是这样说的他只是说不能因为AGZ的强大就说人类的知识本质没有用处只能说透过Zero可以真的"从零学会", 但他们不能评估这两者用同样的计算量 Master 不会输因为在回答过程中aja 不止一次说他们非常惊讶Zero的训练结果（本来以为是根本不可能赢过Master,没想到很快就碾压了）

作者: zeat (L.) 2017-11-10 19:24:00

在台湾，吃方便面配黑松沙士下的XDD

作者: wadashi1 (阿拉丁) 2017-11-10 21:54:00

太辛苦了(算沈迷吗?) 都没有出门或自己煮好好的吃个饭

作者: aegis43210 (宇宙) 2017-11-10 23:41:00

zero的算法也是一直优化才比master强那个人不看好腾讯能完整复制zero的棋力了

作者: oldTim (TIME WILL TELL) 2017-11-11 00:07:00

AlphaGO与其说是科学上的突破，不如说是工程上的奇蹟

作者: staristic (ANSI lover) 2017-11-11 00:08:00

看硬件怎么进步吧，硬件追得上的话说不定20年后变大学机器学习的学期大专题

作者: cubec (cubec) 2017-11-11 04:23:00

https://www.inside.com.tw/2017/11/10/aja-alphago-zeroAlphaGo Zero 只用了三天，就走过人类几千年围棋研究的历程

作者: seaEPC (没看见,我没看见 >_<) 2017-11-11 07:57:00

很佩服deepmind分享知识的作法

作者: sunev (Veritas) 2017-11-11 14:34:00

所以master就已经只用一个神经网络了吗?

楼主: HeterCompute (异质运算) 2017-11-11 17:32:00

对，只用Res-Net

作者: tlchen (台湾加油) 2017-11-11 18:53:00

我很早就提,我们不能只看三天很短,但三天中,它进入高品质的棋局,比人类几千年来的高品质,其实应该是不知多多少倍

作者: Uizmp (黑袍法师) 2017-11-11 18:59:00

这也难说,人类不在对弈的时候, 有些人脑中依然在运算这些只是没有下出来, 或者下出来没有留下棋谱只能说人类的资讯整合能力与计算能力远输于AG

作者: birdy590 (Birdy) 2017-11-11 19:16:00

三天看来很短但那已经累积上百万盘的样本了没有google这种资本一般开发者根本不可能这样设计

作者: wadashi1 (阿拉丁) 2017-11-11 19:22:00

Zero用的设备就像进入精神时光屋一样,1700年用40天达成

作者: birdy590 (Birdy) 2017-11-11 19:24:00

人类历史上所有棋局加起来也不过零头吧质也一定输

作者: ddavid (谎言接线生) 2017-11-12 02:56:00

主要是人类并不是一个整体，有大量的运算资源被浪费在各自算各自的东西，再来就是下完一局棋以评估所花时间太久

作者: lwei781 (nap til morning?) 2017-11-12 13:07:00

人类是各自学流派又不交流

作者: aegis43210 (宇宙) 2017-11-12 19:44:00

alphago lee是13block，Master是20blockzero则有20block和40block两种版本

继续阅读

[讨论] 如果有机会问黄士杰博士问题cabon Re: [新闻] 黄士杰返台分享AlphaGo Zero开发过程capita Re: [新闻] 黄士杰返台分享AlphaGo Zero开发过程jamesho8743 [新闻] 柯洁:只要观众愿意，会继续和人工智能对奕qweewqq [新闻] “屠狗者”再献名作美少年笑笑演绎造劫qweewqq Re: [新闻] 黄士杰返台分享AlphaGo Zero开发过程oldTim [新闻] 会师三星杯决赛唐韦星：我对冠军没欲望qweewqq [闲聊] CGI死活强度Rueyh Re: [新闻] 黄士杰返台分享AlphaGo Zero开发过程tlchen [问题] 有适合小朋友初学棋的影片吗？starlin2