[情报] 不可思议的五路肩冲怎么来的？ asglay PTT批踢踢实业坊

[情报] 不可思议的五路肩冲怎么来的？

楼主: asglay (收收收尾) 2016-03-13 06:35:57

https://www.youtube.com/watch?v=qUAmTYHEyM8&t=15m15s
第三战赛前访问重点整理 - 不可思议的五路肩冲怎么来
AlphaGo 计画的领导人David Silver
(重点听译有误请见谅)
1.
Redmond(美国九段)问：
第二战的黑37手五路肩冲太令人惊讶了，
我从来没看人家这样下过，阿法狗是怎么想出来的？
Silver回：
很多人都问我这个问题，我就回去找资料看看阿法狗到底是怎么想出来的，
阿法狗有个模型，也就是方针网络(Policy Network)，
是利用人类过去所下过的棋谱，来训练这个方针网络，
让这个模型可以预测人类下一步会怎么下。
然后我就问阿法狗，到底过去人类会下这步五路肩冲的机率有多少？
阿法狗说，人类棋手只有万分之一的机率会选择下五路肩冲这步棋。
(咩按：怪不得李世石要中离去抽菸啊～根本整人嘛)
虽然机率很低，但阿法狗还是有去搜寻这步棋，
经过往下评估计算之后(Value Network, Roll Out等)，发现这步真的是好棋，
所以就下了这步棋。
2.
Redmond问：
即使人类下的机率这么低，阿法狗还是选择这样下了，
表示人类选择怎么下的机率不会影响到阿法狗吗？
Silver回：
人类下一步怎么下的机率，只是在最开始的时候，提供阿法狗一些搜寻的初始选项，
实际会怎么下还是要依靠阿法狗自己后续的评估结果。
(咩按：所以阿法狗有点像是依靠人类的过去下过的棋步，
来舍弃一些根本不需要考虑的位置，所以初手大元还是有可能的(误))
3.
Garlock问：
阿法狗几岁？(咩按：这问题...)
Silver回：
两岁。(咩按：开始讲一些古，台湾之光AlphaGo的脸，黄士杰，巴拉巴拉)
去年发表论文，发现光练习古人的谱，不用做任何计算，AI就可以有业余段位水准，
整个很吃惊。所以就觉得很有希望，跑去找CEO谈谈，结果就开了projetc，
找了很多人进来，成就了阿法狗跟这场世纪之战。
4.
Redmond问：
阿法狗打败了世界冠军，有人说你们有针对李世石做软件上的调整，
但刚刚听你讲起来发现好像不太可能？
Silver回：
阿法狗是用几十万份的棋谱去训练出来的，李世石的谱在数量上相比起来，
就好像把一滴水丢到大海里一样，
不太可能显著的去影响阿法狗的棋风，而且阿法狗还有很多自我对局的强化学习。
对我来讲，我们很难调整阿法狗去针对李世石，
相反的，李世石是一个很棒的棋手，
他比我们还更可能去适应阿法狗的棋风。(咩按：其实还挺有道理的)
而且只针对一个棋手去调整，其实还蛮危险的。
我们的设计目标很简单，就是设计一个程式来让胜利的机率最大化。
我们在比赛前我们还中止了阿法狗的发展进程，让我们可以顺利测试，
所以在比赛过程中，程式的版本其实是没有改变的。
5.
Redmond问：
你觉得像五路肩冲这种神奇棋步，有可能会持续出现吗？
Silver回：
我们在比赛中学到很多，从像你这样的解说评论与分析等等，
我们选择李世石也是认为他可以测试到阿法狗的极限，
但其实我们不知道阿法狗会怎么下。
我们虽然创造它，但这时候也只能站旁边看它会怎么下，
不然我现在应该是在努力coding，而不是来接受访问。
(咩按：AI可以让你不用再当好人工程师)
6.
Garlock问：
我听说阿法狗现在好像甚至不需要人类过去的棋谱来辅助？
听说可以从零开始左右互搏训练，也太让人惊讶了吧
Silver回：
目前阿法狗的确是从人类过去的棋谱来学习，
但是从零开始训练，的确是我们未来的计划，
或许棋风会变得很不一样也说不定。
(咩按：最后再说了一些这可能是五百年来最出名的围棋赛等等...)

作者: darkseer 2016-03-13 06:38:00

推

作者: pikachu2421 (皮卡＠めぐ民) 2016-03-13 06:46:00

感谢翻译

作者: darkseer 2016-03-13 07:03:00

再推一次XD，重点撷得太好了话说按照围棋用语会不会称他是日本九段? :p

作者: aaaba (小强) 2016-03-13 07:07:00

太狂了!人类哪有机会在有限时间内探索机率只有万分之一的分支!

作者: Eriri (英梨梨) 2016-03-13 07:09:00

我觉得有意义的是去套讨为什么阿法狗会认为那是好棋人不是因为万分之一没有时间想到而是因为普遍不会认为那是好棋才选择不下让机率变成万分之一

作者: aaaba (小强) 2016-03-13 07:29:00

成为好棋的原因就是alphaGo把那步棋在想像中下了几千次，尽可能探索各种变化，结果还不错，就真的选择下了。

作者: Eriri (英梨梨) 2016-03-13 07:30:00

所以我的意思就是那些变化到底可不可以慢慢被人归纳还是像这些手是永远模仿不能的不过有些人认为胜率高不代表是好棋我是觉得既然AG算到那么多步还认为这是胜率最高的一手那就有研究的价值

作者: aaaba (小强) 2016-03-13 07:45:00

我个人意见是如果并非只牵扯到局部，而是广泛影响到全局的好手，人不必研究了，AG已经研究过了，让他把其中几个变化输出给人闻香就好了。再怎么样探索，单凭人力，下次在比赛中出现类似的盘面，也只能强记，无法即时探索更远。但当人开始强记无法消化的棋步，棋这门可称作艺术的竞技就感觉没有美感了。

作者: enomis (enomis) 2016-03-13 07:58:00

日本棋手表示：你们开始重视下棋的美感了吗^_^

作者: aaaba (小强) 2016-03-13 08:01:00

感谢阿发狗促成围棋必须讲究美感的共识

作者: ForeverOrz (Lumis eterne) 2016-03-13 08:08:00

我觉得换个问法五路尖冲小李为何不爬四路那边要出头

作者: darkseer 2016-03-13 08:19:00

推楼上。也许后续又有什么很不像人类的妙手配合?

作者: allenmusic (艾伦) 2016-03-13 08:35:00

好文

作者: turing (涂妮) 2016-03-13 09:22:00

开盘阶段平均每个点被考虑到的机率是千分之三。对电脑而言万分之一其实不低。至少它还排在候选名单中。我想会不会开盘时所有三四五路的点都想一下。

作者: MaseratiGTS (海神三叉戟) 2016-03-13 09:24:00

人类要脱离制式规范被旧有经验侷限创意才有办法打败阿法狗

作者: darkseer 2016-03-13 09:25:00

我觉得万分之一感觉上已经很接近要被剪掉了耶@@至少传统minimax的变体，如果统计上最佳解机率万分之一应该就cut掉了呗?

作者: MaseratiGTS (海神三叉戟) 2016-03-13 09:26:00

以前觉得不可行的事实上是因为经验累积但人类经验只占不知道几个百分比而已

作者: ming1053 (ming) 2016-03-13 09:27:00

万分之一是职业棋谱带来的 bias 后面他还是有自己考虑

作者: chordate (封侯事在) 2016-03-13 09:27:00

万分之一是高段职业棋手下出的可能性AlphaGo原理上会先用职业棋谱尝试排除那些必败的下法

作者: darkseer 2016-03-13 09:28:00

对orz 我想错了，关键是rollout算到底可能还比SL策略网络快，没理由不同时rollout一下

作者: aaaba (小强) 2016-03-13 09:46:00

其实如果万分之一的机率在所有候选点的排名还有前二十，那机器还满有余裕去细究的。

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-13 09:53:00

我很悲观地想那五路肩冲不是赛中临时测试出来的而是平时自我对练发现的而且已融入AlphaGO自身也就是

作者: LCamel (LCamel) 2016-03-13 09:53:00

网络上有些人说 "AlphaGo 吸收了人类百年千年来的经验

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-13 09:54:00

AlphaGO在比赛前就已经准备了数量不知多少的妙手等著

作者: LCamel (LCamel) 2016-03-13 09:54:00

所以赢李是自然的" 但是从37手前人只有万分之一的机率来看

作者: LCamel (LCamel) 2016-03-13 09:55:00

这个说法已经不攻自破了. 37 手 AlphaGo 是靠自己下的.对不起 moonlind 和你交叉了 orz

作者: moonlind (又多了敷脸卡跟觅食卡了~) 2016-03-13 09:57:00

没关系啦我很期待没人类经验的AlphaGO跟目前的对战借此测试究竟人类的经验究竟孰轻孰重若胜率50% 很可能代表人类所谓经验仅沧海一粟如果胜率低于50%...更惨代表人类有自我的盲点并且累积成不可忽视的缺失

作者: changmada (马大) 2016-03-13 10:09:00

这五路尖冲也只有这局能用吧

作者: raku (raku) 2016-03-13 10:24:00

可以归纳才能被人类拿来使用不过这也将是人类的浪漫了

作者: lifehunter (垄天) 2016-03-13 10:28:00

实际上就是AlphaGo在围棋上已经走得比人类更远了以前常说AI不可能算赢人类是因为围棋盘面变化多达170位数但实际上人类上千年累积起来的围棋经验离这个170位数也还差得很远

作者: MaseratiGTS (海神三叉戟) 2016-03-13 10:31:00

所以必须多尝试以前不敢做的就会变化出不同局势

作者: a0187307 2016-03-13 10:51:00

蛮好奇如果把AI目标设定成赢最大目数会生神摸事

作者: macaber (hmm) 2016-03-13 11:29:00

https://www.youtube.com/watch?v=Qf47NatflfM 47:30那里我觉得这解释还蛮有道理的, 跟前面的尖有关系

作者: aegis43210 (宇宙) 2016-03-13 11:31:00

要设定最大子效的话，一定要设定时间，不然会算到天荒地老也算不完

作者: TSbb (贷款三十年债开始) 2016-03-13 11:34:00

所以在比赛过程中，程式的版本其实是没有改变的。可怕阿也就是其实三战都没有即时更新..........

作者: umano (ぎゃああああああああ) 2016-03-13 14:29:00

https://www.youtube.com/watch?v=SUbqykXVx0A

作者: BHrabal (Es muss sein.) 2016-03-13 21:28:00

这手棋实在太酷了

继续阅读

[转录] 从前两局推测AlphaGo算法的重大进展rgx Re: [历史] 李世石(黑) - AlphaGo(白) 第三局棋谱Pojin [影片] 古力第三盘复盘讲解&柯洁访问回应挑战zkow [讨论] 如果让alphago吃的棋谱只到50年前hayuyang [问题] 柯洁和阿发狗的结局a1223356 [新闻] 柯洁：阿尔法是最强大对手风暴再猛烈点zkow [新闻] 李世石：只是我输了不是全人类wl3532 [问题] 围棋、名局再也不是两个人下的吗a00199bcd [新闻] 棋盘外的李世石：侠骨柔情喜欢看韩剧zkow [闲聊] AlphaGO棋风定型的可能性Likedodo