Re: [讨论] 关于 李世石 VS AlphaGo & AI 进步程度

楼主: ginstein (迈向学术之路)   2016-03-10 08:28:57
因为本身对于一些专业的围棋方面知识并不足够,
但对电脑 AI 方面的进展还是有一些了解,
所以想提供另一种观点以供参考。
※ 引述《wukevinboy (wukevinboy)》之铭言:
: 3.这是最主要的一点,在与樊麾对弈时的 AlphaGo 我觉得水平只有弈城
: 七、八段,至于 AlphaGo 是否有遇强则强,愈弱则弱只要赢就好的特性
: ,或许这是值得观察的一个点。(可能等到软件流出经过多人实际测试,
: 我们才有机会得出相关的结论。)
: ... (恕删)
: 在一开始我对于 AlphaGo 的评价是不高的,现在想想 AlphaGo 水平或许真的
: 是因为对手,导致水平下降,樊麾那五盘棋的水准大约是在台湾业七实力,甚
: 至业余六段可能都跟他有得一下,导致我觉得 AlphaGo 赢他也并没什么好大惊
: 小怪的,当时会出来评论仅仅是因为有太多的读资讯相关的人不懂围棋规则、及
: 判断,各种谣言满天飞,所以想跳出来先讲讲看,避免大家有围棋已经可以征服
: 职业领域的错觉。
: ... (恕删)
: 然而我现在必须很诚实地告诉大家, AlphaGo 的棋已经具备了职业实力,而在与
: 樊麾对弈时,我们这些业余棋手感觉不出 AlphaGo 的实力,主要原因是因为樊麾
: 下得实在不怎么样,就像你今天看 Kobe 去跟小学生打篮球,小学生被电得惨兮兮
: 也不足为奇(当然这说法有点夸大)。
AlphaGo 并不是遇强则强,而是像人类一样,随着训练而会变强,
可以参考以下 U2 短片,以训练简单的打砖块为例,最后成为超级专家,
Google DeepMind's Deep Q-learning playing Atari Breakout
https://www.youtube.com/watch?v=V1eYniJ0Rnk
只不过 AI 成为打砖块的超级专家,不会让人觉得这有什么,
但是在围棋领域上,AlphaGo 成为职业级玩家还是令人震惊!
人类历史上各种发明工具,创造出超过人类本身能力的例子比比皆是。
而 AI 的学习能力超过人类也是早晚的事,
只是超过大多数人(包含我)的预期,等到这一战才发现这时代已经到来。
: 然而看到不少人在以李世石这位棋手指指点点,我想请问那些不曾关注围棋,还有其中为
: 数不少的乡民,如果你们连李世石是一位怎样的棋手都不知道,甚至有人连围棋规则都不
: 知道,就在大放厥词,不是很不理智的行为吗?最近还看到有人说,以X国人水平来看,
: 李世石要赢可能要靠作弊,真的觉得这种言论令人哭笑不得,希望大家可以尊重这次的比
: 赛。
同感!AlphaGo 昨天胜过顶尖职业棋士李世石时,
太多人片面的以为 AI 真的没有弱点,
很多职业棋手和软件多下几盘后,
就能发现软件算法的盲点,从而大肆利用以玩弄电脑。
李世石在开赛前看不到 AlphaGo 本身的对弈棋谱,
只能在一两盘内找出 AlphaGo 的特性,这对李世石太不利了,
即使五盘皆输也不代表之后棋手不能发现 AlphaGo 的盲点。
有了解 AlphaGo 算法的人,让职业棋士了解其思维模式特点,
目前应该还是很有机会赢过 AlphaGo 的。
从一些评论可以发现 AlphaGo 的特点,
布局较快进入缠斗模式(其强项),
不像人类布局较久,对弈较常出现劫材,
可见对弈时,棋手被 AlphaGo 牵着走,
我猜想如果 AlphaGo 一开始就想引战时,
弃一角换取更广的布局时,也许有机会。
不过本身对于一些专业的围棋方面知识并不足够,
还是给职业棋士去发现 AlphaGo 的特点,听其评论。
作者: Eriri (英梨梨)   2016-03-10 09:00:00
我觉得依照阿法狗的演算方法 你很难知道到底是真正的盲点还是阿法狗看到了更远而做这种选择 只有真正多下才会知道而无法单以少数几盘而论
作者: abc55322 (笨鸟不唱歌)   2016-03-10 09:21:00
劫多是因为知道自己有利吧
作者: woogee (woogee)   2016-03-10 09:34:00
有看到对岸文献说AlphaGO会尽量引导对方走向自己已学习过的走法,真伪有待确认
作者: aaaba (小强)   2016-03-10 09:45:00
上面这个说法算是倒果为因
作者: undeadj (undeadj)   2016-03-10 09:49:00
序盘是李逼战才战的
作者: javatea (齁齁)   2016-03-10 09:54:00
现在有盲点, 以后还会有吗? 何谓自我学习?
作者: aaaba (小强)   2016-03-10 09:58:00
alphaGO能下出来的每一手,当然都可说是他学会的。如果他考虑得够周密,人类接下来的应对自然不脱它的意料,局面便顺理成章的向AlphaGo倾斜了。反正楼上的说法就等同于高手的定义,而非alphaGo的特殊技。柯洁也说过:跟李下时,他希望李下出他意料之外的棋,因为那表示那手不够好,早被他排除了。我是说5楼的说法
作者: wukevinboy (wukevinboy)   2016-03-10 10:47:00
其实用想的也大概了解,应该不会有遇强则强的状况,但是因为就这几谱,我才有这种幻觉…感谢您的回复,补充。
作者: coldlian (荀文若)   2016-03-10 11:19:00
打砖块看起来超聪明
作者: sadmonkey (下雨天)   2016-03-10 11:19:00
据我所知跟蒙地卡罗相关的算法收敛都很缓慢,昨天电脑所花的时间并非是故意障眼法,而是程式在模拟无数条路径所需的时间,而以蒙地卡罗收敛速率也许增加一万台电脑也只是微微增加一点棋力,我反而觉得最后电脑围棋迟早会遇到瓶颈,只是不知这个瓶颈到来前的棋力是否能稳赢人类的顶尖棋手
作者: newtonyd (newtonyd)   2016-03-10 11:45:00
到时候会先检讨黑到底贴几目才是真的"公平"
作者: Ebergies (火神)   2016-03-10 11:49:00
AlphaGo 自己持黑白子对练到 50% 左右胜率应该有参考性?
作者: s93rm6 (Milks)   2016-03-10 12:11:00
这比赛是用单机版的 不是多主机的系统

Links booklink

Contact Us: admin [ a t ] ucptt.com