[情报] 柯洁和deepmind检讨人机大战

楼主: HeterCompute (异质运算)   2017-09-15 19:25:32
大家好,今天我们很高兴向大家公布AlphaGo与柯洁九段乌镇峰会比赛的三个覆盘研究视
频。在这三个视频中,樊麾老师分享了大量AlphaGo的想法与思路,以及AlphaGo形势判断
的胜率,对于柯洁九段的一些问题与见解,双方也针对AlphaGo在现场即时给出的下法有
许多探讨与研究。为了让世界各地的围棋爱好者都能看懂这三个视频,我们也特别加上了
英文字幕。
需要说明的是,视频中参与覆盘的AlphaGo与乌镇峰会比赛的版本和硬件配置(搭配4个TPU
的单机版)完全一样。希望大家享受这三盘精彩的对局,也能从这三个视频的覆盘研究中
有所收获。祝大家观影愉快。
Youtube
Game 1: https://youtu.be/HIu9P9wEIsc
Game 2: https://youtu.be/SF486mbvAOI
Gamd 3: https://youtu.be/CUZxe7bXKxo
以上转贴自Aja脸书
以下心得
第一盘:
如果柯洁下的时候看的到胜率2% 3%的掉,可能每一盘眼泪都要掉出来了。
这真的是观念上天与地的差距......
第二盘:
根本完全在AlphaGo的掌控之中,一点都没有接近。
惊人的战斗力,可怕的形势判断,一丝不苟的次序,一点缺点都没有。
Not even close.
第三盘:
瞬间崩溃QQ
作者: RicFlair (Figure-four Leglock!!)   2017-09-15 19:31:00
先推再说XD
作者: vicissitudes (无白)   2017-09-15 19:56:00
推!!!
作者: abc0922001 (中士abc)   2017-09-15 20:08:00
我在柯洁微博有看到XD
作者: depo (depo)   2017-09-15 20:39:00
推!!!
作者: jaw13 (jaw)   2017-09-15 21:22:00
先推再看
作者: hochirijay (uni)   2017-09-15 21:55:00
作者: oldTim (TIME WILL TELL)   2017-09-15 22:40:00
终于出了!先推再看
作者: za755188   2017-09-16 00:11:00
一手掉5% 两手掉10%.....
作者: ddavid (谎言接线生)   2017-09-16 00:31:00
推推
作者: ztdxqa (ztdxqa)   2017-09-16 01:10:00
先推 周末再看
作者: gamania10000 (自助旅行中)   2017-09-16 01:33:00
柯洁穿白色好看.没鹿晗运动季那时那么肿了
作者: KINGTIGERX (细雨 河畔 摆渡人)   2017-09-16 07:13:00
作者: Eric0605 (我还有点饿)   2017-09-16 07:29:00
作者: semihumanity (沙漠之狐)   2017-09-16 08:05:00
推!
作者: sarraya (~ No Game No Life ~)   2017-09-16 11:11:00
作者: ztdxqa (ztdxqa)   2017-09-16 15:37:00
看完了 满震撼的 原本以为(人类观点)很接近的第二个局一点机会都没有 根本不是当初所想只差一个劫材@@
作者: jacklin2002   2017-09-16 16:45:00
哇~推推!!
作者: wadashi1 (阿拉丁)   2017-09-16 17:03:00
这....Alphago这么强,那以后还背什么历史的棋局,以后通通研究Alphago的自我对战棋谱就好了.. 唉...
作者: ddavid (谎言接线生)   2017-09-16 19:06:00
楼上概念完全错啦,因为你研究AlphaGo自战只会看到一堆人类看不懂或就算看懂也没有同等计算能力可以应用的下法柯洁跟樊麾影片中都不断提到了,看AlphaGo下棋只是拓宽你的思路,但事实上你是不可能学AlphaGo下棋的,人类最终还是要用人类能掌握的下法
作者: ilw4e (可以吃吗?)   2017-09-16 20:00:00
第二局是真的很近阿,电脑也一直顾虑著那个劫,结果问题竟然是在右边的几手处理上变成败著
作者: abc0922001 (中士abc)   2017-09-16 20:24:00
你研究AlphaGo的棋谱,某师母又要发FB酸你了
作者: nanlong (懒龙)   2017-09-16 22:49:00
人类如果有AlphaGo那样计算力~大概可乐胜。
作者: Yibooo ( )   2017-09-16 23:48:00
话说某盗版频道太猛了竟然盗这3盘xdddd他不知道原版是发在deepmind官方频道上吗xd
作者: saladim (杀拉顶)   2017-09-16 23:53:00
读一波 练一波 超爆干强职棋二
作者: CGary (下雨天也挺浪漫的)   2017-09-17 01:23:00
第二战是"前段"很接近 处理到一定程度后柯洁就没戏了...研究AG的自战棋谱会完全不知道AG为什么这样下 跟我们一开始学棋就只看旷世奇局一样 学到的很有限 可能是完全看不懂
作者: aegis43210 (宇宙)   2017-09-17 02:26:00
第一战下个几手,厚势就消失了,学到好多
作者: dudu5566 (仁甫哥超MAN!!!)   2017-09-17 13:18:00
希望有中文字幕版 柯洁讲话好糊又小声 听的好辛苦
作者: qqq1397 (浑汲噩营)   2017-09-17 13:49:00
樊讲的超烂不提。重点是他手上的笔电应该就是Alphago可家用版本:设60s跟长时间树不一样,一步搜下十手、跟每步搜树也不同,应该不只是数据库这么简单
作者: RicFlair (Figure-four Leglock!!)   2017-09-17 13:50:00
两人说话声音很小 但笑声超大XD
作者: saulesmeitas (太阳女)   2017-09-17 14:12:00
应该是他们有时候会离麦太远…
作者: staristic (ANSI lover)   2017-09-17 14:20:00
声音问题是麦克风不在他们嘴边,当他们身体前倾就大声往后倒到沙发上就小声
作者: oldTim (TIME WILL TELL)   2017-09-17 15:02:00
这期的流程中因为常有等待Alpha搜的闲置时间略显松散了些如果把中间搜的时间剪掉,多搜一些变化会更好
作者: ilw4e (可以吃吗?)   2017-09-17 15:32:00
第二局总共就155手,100多手都还持平硬要讲成"前段"XD樊胜率都告诉你了,大概就是右边100多手后的处理崩掉了
作者: ulycess (ulycess)   2017-09-17 17:19:00
第二盘中间还是60:40,中间两三手瞬间变成70:30
作者: AirOctopus (AirOctopus)   2017-09-17 18:34:00
(各手数胜率) https://i.imgur.com/7n5sedq.png第二盘黑棋55手时"挽回"开局劣势,56手后开始占优87手黑占优但白仍可下,107手白大劣,109手分出胜负照樊麾说词,胜率40~60 = 差不多,(开局55的白棋,跟据自战是76%胜率,我想那60大概是88%之类的吧。)超过70代表赢定了(最后根据michael redmond的情报,AlphaGo现在最新版已经比柯洁版更新好几代了,以胜率看让先柯版应该可行
楼主: HeterCompute (异质运算)   2017-09-17 19:04:00
我猜michael唬烂,现在除了deepmind没人知道alphago有没有再继续训练
作者: AirOctopus (AirOctopus)   2017-09-17 19:12:00
Michael有问deepmind的人,他现在在做AlphaGo自战解说
楼主: HeterCompute (异质运算)   2017-09-17 19:19:00
光michael对于alphago雪崩的言论我觉得基本唬烂光M对于AG不下雪崩的理由,我实在很难相信他有问过
作者: lwei781 (nap til morning?)   2017-09-17 19:29:00
不过Aja. 有说某些开局 Alpha 更不爱定型 会先动手
作者: staristic (ANSI lover)   2017-09-17 19:30:00
请问Heter大,Michael的言论有出处吗?
作者: AirOctopus (AirOctopus)   2017-09-17 19:39:00
雪崩那是他自己推测的,有更新版是DeepMind跟他讲的Michael又没说雪崩一定怎样,只是说他认为可能是怎样
楼主: HeterCompute (异质运算)   2017-09-17 19:42:00
我有点忘记是他在哪一集说过你说的这些,AO棋友还记得吗?我想确认一下他用的字词是什么
作者: AirOctopus (AirOctopus)   2017-09-17 19:52:00
https://goo.gl/KubScR 大概8:30~10:00,讲点三三那边
楼主: HeterCompute (异质运算)   2017-09-17 20:03:00
没看到M有说他有问DM啊?只说DM短期大概不会放出data
作者: AirOctopus (AirOctopus)   2017-09-17 20:05:00
9:00他不是说:"I think they are saying AlphaGo isseveral versions ahead of Ke Jie version now"
楼主: HeterCompute (异质运算)   2017-09-17 20:12:00
they是指deepmind吗 之前也没提到过啊@@
作者: AirOctopus (AirOctopus)   2017-09-17 20:16:00
之前没说,但9:23 Chris说:"So the deepmind guyshave your contact information for when..."很明显就是说deepmind不然会说谁
楼主: HeterCompute (异质运算)   2017-09-17 20:29:00
就算退一万步来说真的they是DM,但是他又加I think如果有确切听到会这样说吗?
作者: AirOctopus (AirOctopus)   2017-09-17 21:10:00
可能跟某个员工聊天时聊到之类吧
作者: uyrmb47   2017-09-17 21:20:00
奇怪了 他无缘无故唬烂啥 是你才奇怪吧
作者: saladim (杀拉顶)   2017-09-17 22:16:00
很可惜不是把当时对战的纪录档 像是思考过的变化图之类的
作者: wadashi1 (阿拉丁)   2017-09-17 22:16:00
可是..不是柯洁下完之后,阿杰就放长假,然后就要调别的工
作者: wadashi1 (阿拉丁)   2017-09-17 22:17:00
作了. AlphaGo还可以更新好几个版本,是怎么回事啊?https://www.facebook.com/aja.huang Aja脸书,8/7上班
作者: kenwufederer (Nash)   2017-09-18 10:40:00
影片最大声大概是樊落子的声音吧不懂摆棋每一手都拍那么大力做什么…然后变化图手顺一直错,樊不能完全看完再摆吗?虽然可能事先没有棋谱,可是摆棋的过程与感觉一直反复,比樊之前解说自战还差…身为职业棋手,每手都大力拍棋跟手顺一直反复…实在无法认同…当然这只是我个人想法
作者: jaw13 (jaw)   2017-09-18 11:14:00
樊上次自战就一直摆错了 他说alphago不肩冲33后 害我对他讲的东西都抱持怀疑
作者: oldTim (TIME WILL TELL)   2017-09-18 11:27:00
基本上在搜寻中间讲的东西都是垫档用,不用太认真
作者: kenwufederer (Nash)   2017-09-18 12:14:00
我觉得他直接给柯洁看,搞不好比较好讲…虽然是当下另外的搜寻,但我觉得他们是在节目上樊是职业棋手吧?
作者: qqq1397 (浑汲噩营)   2017-09-18 16:49:00
垫档讲一些其他无妨,重点是该讲的不讲不该讲的一直扯。一场集一直出包一直没差,TMD1%没差3%没差8%也没差的,没差就直接讲数字啊,讲一堆无意义干话谁跟你没差!第二盘一直持平55才是没差。
作者: wadashi1 (阿拉丁)   2017-09-18 18:11:00
大家都想吸收一些阿法老师的功力,但又怕被误导..
作者: peterhuo (人生位阶乐胜真爽)   2017-09-19 23:21:00
还在接近,事实就是一点也不接近

Links booklink

Contact Us: admin [ a t ] ucptt.com