[讨论] Google DeepMind - AlphaGo vs 樊麾

楼主: wukevinboy (wukevinboy)   2016-01-28 18:50:39
先说说我个人看法,我觉得这软件水平在弈城八段左右。
真要说他有没有九段,我个人觉得应该没有。
另外说说中国水平弈城九段的棋友对这软件的评价,
里面有几位是中国强业五,业六,已定段朋友的群组评论。
假棋、花了多少钱、我让两个试试等等的..... XDDD 当然有点逗了
接下来是我自己对棋谱的理解,因为很久没下了,所以我得棋力已经不太ok了,
都是我个人的评论,如果有错误请指正~
对于这次如果你认为这是围棋软件实力大幅提升,我认为这是很正确的观点,
但如果你认为这是围棋软件已经达到职业水平,可以完封欧洲围棋冠军,那么
...你可能要先看过棋谱 XD ?不要太过于相信新闻,现在这位测试者我认为顶
多中国业五,台湾强业六水平。
第一谱
http://lgs.tw/qoesav1
截至第十手,白棋都是很正常的布局定型,黑29手感觉很奇怪,感觉应该一间
低夹来定型,或者是说更前面白挂就该采取夹击,让白20手成孤棋,但黑棋居
然让白棋简单拆二定型,感觉白棋20手的逼也是赚了一著,黑棋31的小飞位置
,以布局来说我觉得应该下O3,但是黑棋居然拆扁的位置...实在很怪。34拆
二感觉是缓著,35尖反而刚刚好黑棋补好...后面的走法可能不一定是好的,
但是...我觉得可能有更好的走法,但对业余来说我觉得还算在可以接受的范
围内吧?
57和58的交换,我个人感觉57有点问题。63和65的走法,个人感觉是在帮白棋
赚实地,所以感觉得出黑棋根本没想要赢的感觉。75、77狂卖劫材,不太懂为
什么要走。85为何不直接87单补也是让我觉得很怪异。白88的虎黑棋居然直接
接着,以子效来说绝对是往中央跳一个之类的,而不是单接。
105和106交换明显很怪异,真要下的话,为什么不106再下拖一个或者单接?打
到这里我看一些弈城中九,大陆强业五、六,对这软件的评价是让两个,有人
甚至说臭到不忍直视.....121还是觉得可以往更里面跳一点,不知道有没有更
深入的走法,到146黑棋121的问题就体现出来了,因为中央也成了一定的空...
后面的收空也就不看了...
补充:130这手棋,对局者本身说是忽略了,然而我认为这手棋确实是体现出了
电脑的水平。
第二谱
http://lgs.tw/q9qw5f7
好,前面雪崩我就不检讨了,打算开实况在检讨,这种棋如果要检讨实在
太麻烦...另外这定型我也觉得很诡异.....因为完全不按谱的...走完这
串到40手我认为是白棋好下的局面。然而44的长是否该改成跳有待讨论,
比较不理解的是,46推了48又冲了,如果没有很好的手段,48手就是俗手
,而走了几手后,看起来就是白棋误算...或者根本打算出错,根据前面
几谱我基本上觉得这棋是不是有"正常"下已经可议了。
而后续我们看了一下,这棋白棋并没有特别好的手段,而白62力挽狂澜,
想要弥补错误,靠了一下貌似腾挪好手,但后续被吃掉后,虽然白棋中腹
有巨大的潜力,但我觉得还是被吃太多了。86手是厚实的一手可以理解,
而后续黑87挂白88飞貌似也不是很好的一著。虽然黑棋走得很烂基本上帮
白棋走成好型,走到115白棋右下莫名其妙的,原本不好定型的棋却变成
成功的定型...实在让人诧异。
116~120是想要把中腹都变成姓白的,而122的靠适应手,整个活掉我认为
白棋适应手算是成功的,后来仔细看一下黑棋可以吃白棋,不吃的原因,
很可能是电脑判断觉得已经赢了,然而白棋想要硬撑著围住中腹,我认为
实在有点不切实际,但我比较好奇的是165白棋真的只能乖乖应吗?很想尖
N11,如果成立那黑棋不是要全死在里面了...而我这部分打算都丢到开实
况来研究,看一下是否必须应的。到最后如果166必须应,白棋基本上已经
无法扭转局面了。
补充:166感觉是没有什么机会不补,看起来白棋白穿入后没有特别好的
办法应对,来扭转局面了。
第三谱
http://lgs.tw/q4ioppv
这是我觉得挺莫名其妙的一谱,和第五谱前面一样的双挂一样的诡异定型
,都让我觉得电脑对于这局部的定型不太熟悉,因为18手有点怪怪的,可
以说是臭棋吧,通常18手应该是下在20单跳的位置,所以造成诡异定型。
当然这定型我也不太了解,但我不太会去走我不太熟悉的套路。这次的定
型我觉得黑棋定型定的比第五谱好,到36手我觉得黑不差,因为白中央不
知道在干嘛..至于后面白棋帮黑棋围空,如果是我的话我会想要执黑,但
也不一定就是黑好了。因为F9也有一定的"隐患"在。而后续白52打入搅乱
局面我认为是可行的一著。但对于白60板了一下,黑居然去下61,真的不
能理解,先不说白上面有没有机会活了,就算没有机会活,也留下了成千
上万个劫材...,61的走法不能理解。64终于开始对黑棋动刀了,这也是
我说走到51我觉得 55波,我偏好黑一点,but还是有一定的隐患在。之后
黑棋跑两子越跑越重,不能理解。如果我来下可能就左下角孬补一手算了
。实战黑棋的走法相当于把自己逼像绝路。
黑棋67的丁主要想要刺白棋的点方位置,喵著断点,但是白68好手黑棋自
己本身也是气紧的状况,所以白棋的攻击黑明显不好。不得不说白68手。
展现了这款围棋 AI 具有相当的实力。白棋80手的丁,体现出了围棋AI的
敏锐度,这盘棋可以说是围棋 AI 真的让我可以接受他是目前我看过最强
AI的原因了,不得不说80手的走法很犀利。但黑棋的走法就显得很悲哀了
,从原本我认为还不错,搞到两边不活。
92手补一手,可能是想要杀黑棋的手段,但是不太能理解黑棋93手,不知
道是不是没有意识到白92手,让他少了眼位的状况。黑原本有做眼且阻度
的手段,但白92自补一手后,黑棋却没有招了,93手飞可能是不得已,可
能是漏算左边的状况,详细是什么就不清楚了。走到这里黑棋已经崩盘。
97、99手的挂法,让人觉得这黑棋真的会下棋吗...还是已经自暴自弃?
后面111手的靠白棋的板起,后续走到118白棋还能接受。但是124的走
法让我觉得无法了解,感觉不如单飞一手算了。帮黑棋全围上,后续132
的接又落后手。145完全看不懂,理当下在146补上也就是了。最后让白
棋又冲来杀去的。被154打了三子后,黑棋基本上不行了。
第四谱
http://lgs.tw/q2fccid
至20,我觉得这些布局都是个人喜好,没有什么太过于大的问题,当然
如果要说小问题,那肯定还是有的,只是我在这里就不检讨这些,因为
我对于一些比较细微的问题我常常自己也搞不清楚,黑 21、23是常用的
连环拳,但是白24显得奇怪从某种层面来说,我个人认为是在帮黑棋加
厚,到31黑棋明显舒畅,白棋没活,还要逃亡也没办法对黑棋左边空上
有任何的威胁,相反的因为自己本身薄弱,所以造成黑棋有机会两边围
到,33后续的走法意图分断白棋,到这里我觉得这白棋布局明显的有问
题,而黑棋走道45后,我个人认为可以47可以考虑飞 H18直接把对方全
数歼灭,当然这是我个人的观点,有点暴力也不一定成立,不过47走一
下也是可以接受因为我个人认为这黑棋已经大优了。
49立下,变成白棋两块没活,即使活了也很可能是大家所谓的两眼,或
者是苦活,到这里白棋布局我觉得完全是失败的,至于问题可能要归于
24手的疑问手。走到64,白棋虽然两块都算是暂无死亡的可能性,但也
已经算是有点溃败的感觉了,黑棋中央的厚势,左边的成空,都有一定
的目数,而反观白棋上边的目数较扁,下方的目数又显得很不扎实。
从65~70的交换,我们可以看出电脑对于劫材的敏锐度,很明显的并不高
,所以真要说这电脑有什么大问题,劫材判断还是有点问题的,75的打入
白棋的应对方式竟然是先尖了,和黑棋77交换,这明显是帮对方补厚的走
法,相信有一定水平的棋友都知道,这种先虚刺的棋并不可取,在一些特
殊情况下才可以成立,但在这里我并不认为这手是必要的。79我们又再次
看出电脑围棋对于劫材的敏锐度很差,这样的着手说要到达职业我个人认
为真的是太夸张了,而后续对于黑棋81的打入,我认为应该有更好的着手
实战黑棋整个先手捞掉上边甚至角空,很明显的白棋应对大失败。
黑棋99打入应该"可能"是全局最大的一手,然而白100手踢,是否是好的
应对我个人认为有待商讨,我更倾向于上面飞镇攻击,因为白右边的角
很厚实,而102飞一个黑棋立即点入,白棋以下的应对真的没有职业棋士
的水平,黑棋竟然就在白棋的根据地中打出一块安定的活棋虽然白棋进
角了,但边上的损失确实是太大了点。然而这时候黑棋117是我一直很有
疑问的一手,如果给白棋来下板过去是成立的,为什么白一直不板掉,
我前面的可能是最大的一手,特别加上了双引号,意思就是那手棋如果
直接板吃掉,可能更大一点。而且对白棋整块厚味也有加强的效果,现
在117被黑棋补上,白棋上方极有可能变成龙。
后续黑棋白棋走了几手,到128、130我真的觉得这种局面下还要苦活,
我大概已经没办法接受了吧?可能是我我就投了。黑131飞到,基本上
可以宣告白棋输掉了。几乎没有地中腹又几乎全姓黑了。后续134的刺
我个人认为,黑棋完全可以 L6 二间跳一个。简单围上也可以了,奇
怪的是后面白棋居然又出了棋,以职棋来说打这种勺子实在有点惊人。
第五谱
http://lgs.tw/qsgqyc0
到第八手都是很正常的迷你中国流,16双飞燕是必然,后续走法我也有点忘了
但是实战黑棋明显放水,17手算是正常走法,但18手 google 点入看似捞空的
好手段但实则不然,应该单跳20手的位置。详细走法实况聊~因为我也不是很
确定怎么走XD?
31飞一手貌似是必然的一手,因为没下黑好像棋型也是薄弱,所以我认为必走
,原因是31走了可以加强自己,然而33长,按理来说应该是后手了,白棋AI又
去跳一手,以我的判断应该在上面黑棋大空打入一手调一调之类的。34会去应
可能是担心黑棋,B5尖一下有虎过去的手段,所以 H3 拐会成为先手拐。
38打入感觉上是过硬的,我可能没这种把握,因为有点过于深入,40手直接板
底下,不太了解但如果用长的,可能确实会遭到一阵猛攻,然而不管怎样我个
人在这里会偏好消多少是多少不会去板二路,因为被黑棋虎上面有点不能接受
,这样反而黑棋走在外面白棋走在里面,白棋显得小了。
53手55手走法更是让人不得不质疑这是假棋,试想53手后接续的55手有走到空
吗?我个人认为没有,如果单纯53手我觉得可以考虑,但53后55实在没空怪异
如果是我我更倾向于挂右下角,白棋虎一个是可以理解的因为不虎,黑棋连一
手有一定价值还是先手,然而黑55竟然跟着应了,我个人更倾向于直接全部连
厚吧?另外上面我觉得53手也可以考虑去补后上边,后来也被白棋动出了。
56拐出,黑棋退一个,可能是必须的,但感觉也可以板起,紧着白棋的气,而
后续白棋的靠,和64得靠看起来是很有手段的组合拳,实则不然,我完全不明
白为什么黑65要长让白66挡下,照理来说 65=66是可以挡住白棋的,白棋貌似
没有什么手段,67也是无法理解,为什么要让白棋吃的这么干净,所以这盘棋
的真实性实在让人怀疑。69也是怪著,为何不贴在70位,到这里基本上有一定
水平的棋友可能已经开始怀疑这所谓电脑超越职业的真实性了,从我和一些水
平可能已经在职业朋友的观点来看,这棋是否是假棋,是噱头还是真的这职业
太久没下,所以下成这样,我个人认为台湾每位职业棋手都不会输给这软件。
75打了后手,然而全盘我认为最大的挂角一直没有人走,实在是很诡异。78的
冲根本是自杀性的一手棋,而后续黑棋走法截至91手我认为都没有太大的问题
,93手让人质疑,感觉士单官挥了一手棋,如果是我来下我应该会直接挡在94
,对目数有一定帮助之外,我中央也不用再跑,如果要走93那必须是我很有把
握把中央白棋那一团杀死,不然93我不会直接走,太过于冒险,从后面来看要
杀白棋并不是特别容易,虽然我觉得后面攻击黑棋颇有收获,但121黑棋的打
吃实在有点问题,如果我来下白棋应该不会尖回,而是直接板 K13,然后虎一
个之后连二子和断黑四子二选一。
右下角的打劫让人觉得奇怪,转换后感觉黑棋也没赚到...主要是后面的走法太
奇怪到这里这盘解到这里差不多了,主要是感觉黑棋很多缓著,甚至很多不可
理解的走法,让人质疑了这次比赛的真实性。
附上一些最近围棋 AI 相关的新闻 & 连结
Google Deepmind
http://www.deepmind.com/alpha-go.html
iThome
http://www.ithome.com.tw/news/103607
Mark Zuckerberg (脸书创办人)
https://goo.gl/6oYULI
以上是最近关于围棋 AI 的新闻,大家可以参考一下。
围棋 AI ,我对于目前的实力确实有点震惊,但是如果说它因为这次的比赛,
而让大家认为已经具备打败职业棋士实力,我个人是完全无法认同的。
如果对于这篇讨论文,有什么错误的分析,麻烦留言一下,让我在思考一下。
另外原本想开实况之类的,但因为好像 碁人 有专业的老师愿意讲解,所以我
就先丢了篇文字档上来就好。
https://goo.gl/lMvGrK
一人一 +1,大家听讲棋XD?
最后:我听了一点围棋TV的对局者谈话,我不得不批评,今天对于他自己本身
发挥,说了因为第一盘输棋,心理素质已经不行了。那我认为自己本身已经称
不上专业水平了,今天既然有勇气说了自己是专业棋手,那就不应该出现太多
的心理问题...
而这一次的事情,确实要思考一下,当 AI 超越人类水平,大家确实要思考一
下之后的事情了。
作者: andylin8707 (新垣是我的)   2016-01-28 18:56:00
老大赚P币不是这样赚的阿 认真推
作者: sky0302 (free)   2016-01-28 19:03:00
我看的第一盘和你的不一样 哈哈 这盘我没看到
作者: kd1523 (雨)   2016-01-28 19:08:00
超认真的文啊
作者: aaaba (小强)   2016-01-28 19:42:00
跟李世石下奖金有一百万镁,应氏杯才四十镁,如果不是快棋,李应该能赢,这个电脑弱点就是超一流的训练棋谱不够,大部分的招法是透过中等棋手的谱训练出来的,至于强项就是速度快,打勺的机会低。
作者: sky0302 (free)   2016-01-28 19:45:00
石头又要狠捞一票了 上次500万人民币 这次100万美金
作者: aaaba (小强)   2016-01-28 19:50:00
柯洁不知心里做何感想,一百万镁我也想赚啊,等下次搞不好人类就赚不到了啊!
作者: sky0302 (free)   2016-01-28 20:13:00
可以看新浪棋牌的新闻 普遍认为谷歌相当于业余顶尖突然想到如果下座子棋和还棋头 不知道电脑会不会短路 哈
作者: jackeikuo (逸容)   2016-01-28 20:27:00
它学了 16 万盘 KGS 6~9 段的棋路如果把所有职业对战谱都丢进去学不知会如何
作者: sky0302 (free)   2016-01-28 20:30:00
小米说是冲段少年 李喆说是顶尖让先倒贴 柯洁评价也很高
作者: aaaba (小强)   2016-01-28 20:41:00
以现在mtcs这个AI的做法,让子应该不影响人工智能的发挥,因为他其中第一块核心是计算盘面双方赢棋的机率,这边双方盘面子数不一致不会造成任何问题。而另一个核心是筛选几个可以落子的位置让第一核心来评论胜率,再选出最好的下,这块也跟让不让子关系不大。mcts
作者: sky0302 (free)   2016-01-28 20:57:00
新浪说了 比赛真实性有问题 但也不排除谷歌隐藏实力不过敢约战石头 感觉善者不来 来者不善 当然还是看好石头
作者: aaaba (小强)   2016-01-28 21:04:00
基本上nature期刊和google研究水平应该值得相信,至于欧陆二段的水平到哪,那是那位仁兄的问题,研究人员图的就是他那个欧洲冠军的头衔,先拿下一个里程碑打响自己的名声何乐不为。
作者: sky0302 (free)   2016-01-28 21:09:00
那个欧洲冠军都说了私下和谷歌有协议 反正到时就知道了
作者: ggoutoutder (女朋友的左手)   2016-01-28 21:09:00
小李输一盘我就一年不尻尻
作者: aaaba (小强)   2016-01-28 21:16:00
私下协议可以理解啊,因为棋下完,paper还没刊出啊,做研究的最怕成果被其他竞争团队抢先发表,即便你成果再好,只要你不是第一个突破职棋障碍的,都有可能以创新元素不高而被退稿。况且是nature这个等级的期刊,如果其他团队先发表个五战三胜的成果,你五战五胜再来也没用,只能摸摸鼻子乖乖去投其他次级的小期刊吧
作者: Seikan (星函)   2016-01-28 21:28:00
开赌盘的时刻又到啦! XD
作者: staristic (ANSI lover)   2016-01-28 21:31:00
二月底开吧,让我好好想想要怎赌
作者: goldduck (哥达鸭)   2016-01-28 21:45:00
光是不失误就强很多了
作者: sky0302 (free)   2016-01-28 22:03:00
所谓协议 根据新浪报导 是指棋的内容上 反正很隐讳不过感觉谷歌有点越级打怪 应该先正式比赛赢个孟泰龄之类
作者: staristic (ANSI lover)   2016-01-28 22:06:00
有看到有人猜是不能下打劫的变化,感觉这猜测有像
作者: aaaba (小强)   2016-01-28 22:22:00
我看新浪只有提到保密协议,这是要学术领域很常见的做法。至于有没有限定可不可以打劫,我认为如果论文没写修改了部分游戏规则却暗地偷搞,是很没道德的事,我是选择相信作者报告成果的诚信,否则人类最高等级的学术殿堂nature岂不是沦为一本废文集。
作者: sky0302 (free)   2016-01-28 22:29:00
三月就知道了 如果出现什么级位的失误 就对石头太失礼了以后每年办个谷歌杯宇宙围棋最强人机对抗赛也不错 哈哈
作者: aaaba (小强)   2016-01-28 22:40:00
即使到时候有失误,也无法用来否定目前战胜欧冠的成就。即使这个欧冠对棋界而言还不算一流,但拿来当个里程碑打打广告还是站得住脚的
作者: sky0302 (free)   2016-01-28 22:45:00
敢向石头挑战 应该不至于有低级失误 不然像疯石对依田下到官子变级位 就很冏 = =
作者: maplefoxs (狐狸怎么叫)   2016-01-28 22:49:00
如果不告诉我黑白分别是谁,我还以为电脑那方是职棋...这职棋的下法也太僵硬了
作者: sean51623 (千阳)   2016-01-28 22:55:00
解说不错
作者: yyhsiu (hsiu)   2016-01-28 22:57:00
每年举办应该不成立…应该某一年开始 电脑就会一直赢了
作者: sky0302 (free)   2016-01-28 23:04:00
若只是模仿人类 那最多和人类顶尖并肩 围棋虚的地方太多
作者: tsai18 (......)   2016-01-28 23:20:00
欧洲冠军明显有让 太复杂的情况都尽量避开了
作者: yyhsiu (hsiu)   2016-01-28 23:23:00
或许观念只能和人类并肩,但局布计算力是人脑必输的
作者: aaaba (小强)   2016-01-28 23:23:00
策略上可以模仿人类,弱一点也无妨,在计算深度与广度上大赢,也是ai常干的把戏
作者: yyhsiu (hsiu)   2016-01-28 23:25:00
没错 极端来说,哪天电脑可以直接硬干所有可能性就很确定能赢了,可能连“正确”黑棋要贴多少目都算出来了
作者: sky0302 (free)   2016-01-28 23:27:00
问题就是围棋的局部计算是要服务全盘的 下九路的电脑必胜把古往今来那些和全局有关的妙手来考电脑 不认为电脑能行
作者: Rueyh (追寻永远)   2016-01-28 23:42:00
看完觉得 不如我来下吧
作者: aaaba (小强)   2016-01-28 23:44:00
你的质疑应该成立,但那应该就是因为全局有关的妙手在所有用来训练电脑的材料中犹如沧海一粟,被大量本手所掩盖。但别忘了这个ai可以自我精进,也就是某次他好死不死算出妙手,他就拿这著妙手来修正自己的算路(reinforcement learning),这种技术就“有机会”让人吃土了,那个人有办法自己跟自己每天下几万盘棋,吓死人了。
作者: ztdxqa (ztdxqa)   2016-01-29 00:25:00
可以问一下原PO弈城八的水平是多少吗?冲段少年? 5-0 这比数实在有点悬殊 意思是弈城八的网友们都可以电欧洲冠军不知道板上有没有职棋可以来说明一下这AI水准
作者: sky0302 (free)   2016-01-29 00:50:00
小吴应该是乐观型棋手 要我上 下番棋肯定赢不了 呜呜围棋TV有做即时节目讨论 蛮多料的 感觉很有趣我觉得电脑最强的还不是棋力 而是稳定性的绝对心理优势可以比做加强版的巅峰李昌镐 以前很多棋手说还没和大李下就觉得已经输了 也就是面对电脑 人类的心理负担太大了若论绝对棋力 我不相信有电脑可能能超越人脑如果有一天 电脑真的一对一 彻底完败世界最顶尖那就来下加压棋 不然对人类太不公平
作者: sixersai (键盘华生)   2016-01-29 02:21:00
看完只觉得很假 肯定有人下假棋
作者: sean51623 (千阳)   2016-01-29 02:26:00
最开始看完之后 觉得电脑不太行 但其实是人类没有逼出电脑极限 我觉得电脑实力究竟到哪还值得商榷
作者: jord (灭)   2016-01-29 02:59:00
看棋谱觉得电脑比我想像中的强...我应该下不赢我觉得电脑可怕的地方在于他有可能跳脱一些框架一般人则是会有很明显的棋风与相对应的弱点业余高段的棋其实还是犯很多错 如果电脑局部不犯错那其实就已经很可怕了 毕竟有些错不是大局官可以弥补
作者: BigShotBob (BigShotBob)   2016-01-29 03:25:00
还没仔细研读论文 不太知道电脑到底可以学到哪里但没意外的话 这几个月应该都在学职业棋士的棋谱吧@@看围棋TV的解说去年10月他的实力水平大概在接近但未到职业的水平 布局弱 中盘官子强 当然这是以中国棋界的标准 欧洲标准一定是职业级的了 台湾标准就不确定了但不管怎么说这个AI已经非常接近职业水准 跟Zen是完全不同等级的生物啊 真可怕 期待三月的比赛不过不得不说这Google实在是很会广告XD
作者: ddavid (谎言接线生)   2016-01-29 03:59:00
我没去看其技术细节,但“好死不死算出一次妙手从此以后就修正”这回事是不是容易发生可能还得细看技术细节电脑的学习这回事其实跟人类的学习模式相差很大,相较于人类下出一次妙手就有可能一直爽爽用到被破解或被证实为止,电脑的学习除非你找很多专业棋手天天来跟它下棋,否则偶然自己下出的妙手就我浅薄的知识来说其实成功学习的难度比起人来说还是低很多当然不是说不可能,因此才说需要看细节有没有针对这方面做设计即便有采用reinforcement learning,如果没有特殊设计还是不容易学到偶然妙手的,特别是在它其实并不一定每次都能利用此妙手发挥价值的情况下。我可以举个简单的例子让就算不懂机器学习的人也大略思考一下。比较好的情况是有天电脑下出妙手赢了(或被判断得到优势),因此此妙手的成功与失败是1:0。但大量的棋谱跟自我模拟会看到很多的本手,假设某手是个60000:40000的成败比好了。你会比较信任哪一种下法呢?那个1:0你很容易就做出各种质疑,60000:40000却是千锤百炼的结论。当然,人类的优势就在于可以靠灵感、热血或某些不理性硬是去钻研这一手,最后发现这真的是个妙手。但电脑的运算虽快也不是无限的,它学习或选择的优先级还是存在的,并且往往依赖大量的数据,只出现一次的可能性在没有特别设计或加入额外背景知识的支持下,它还是相对不容易去优先考虑学这个东西的。而且以上还是最佳情况,运气不好时是下出了这个妙手但后续并不太会利用,结果虽然下出了好几次却只是个2:2甚至1:3,这反而导致更学不到的可能性也是存在的。因此如果没有特殊的设计,其实自我学出妙手这件事的期待性并不高。呃......坏习惯又来了,不小心直接推文超过一页......XD
作者: aaaba (小强)   2016-01-29 04:24:00
我有看论文,自我对弈后会根据胜负微量修正类神经网络的权重,中间若有妙手,大方向而言会反映在对局的结果上。而统计上这种名为SGD的优化技术会让训练结果更好。并非一次出现妙手就立刻学会,而是修正一点点而已。在机器学习这个领域一笔训练样本不会起到决定性的效用,而是反复累计可能数以百万计的经验。
作者: ddavid (谎言接线生)   2016-01-29 04:31:00
我的想法是说,新的(对应于已经学得差不多的部分)妙手太少笔就会导致学不起来 + 就算靠大量自我模拟对局以乱数性使妙手更容易出现,但也无法保证后续利用成功,有可能反而埋没妙手。我知道如果这个妙手在自我模拟大量出现,而且都利用得相对成功当然是学得到的,这没有问题。主要是在想说除非有很特殊的设计,不然埋没妙手的情况应该也不会是少数情况,这会导致学到某个水准以后模型收敛,无法再靠自我模拟对局再让棋力往上,这种情况只有喂大量新的真实且更高段的对局才有机会打破这个收敛结果再次往上。
作者: aaaba (小强)   2016-01-29 04:39:00
我定义一下妙手:人类棋感(相对于alphaGo的policy network)上不会去细算却可得利的落子位置。而mtcs算法就是有一定机率会去算到冷门位置,假如塞到不错的选点时,就等于偶然下出妙手。
作者: BigShotBob (BigShotBob)   2016-01-29 04:42:00
我觉得以目前这个算法 光是用打败欧冠的AI当成pretrain model 在大量输入职业棋手的棋谱去学习
作者: ddavid (谎言接线生)   2016-01-29 04:43:00
你有看了论文全文吗?我只看了Abstract,就跟你说到的部分
作者: aaaba (小强)   2016-01-29 04:44:00
的确是无法无限制长棋啊,不过百尺竿头更进一步的效果是还有的。
作者: BigShotBob (BigShotBob)   2016-01-29 04:44:00
(fine-tuning)就可以达到相当不错的职业水平了
作者: ddavid (谎言接线生)   2016-01-29 04:45:00
差不多,其实我主要就是在想MTCS到底埋没妙手的情况比例会
作者: BigShotBob (BigShotBob)   2016-01-29 04:46:00
当然随机性跟那些learning rate的调配这就给最佳化专
作者: ddavid (谎言接线生)   2016-01-29 04:46:00
有多高。高到一定程度会导致前中期学习很快,感觉不断地变
作者: ddavid (谎言接线生)   2016-01-29 04:47:00
强,但后期收敛了就不会再算出新的东西,即便MCTS也无法让被舍弃的死去妙手重新被算回来了。
作者: BigShotBob (BigShotBob)   2016-01-29 04:48:00
擅长的左右互搏术去强化 当然要到顶尖一定需要更强的算法 不过这又是一年后的事了吧 抱歉截断好多回文
作者: ddavid (谎言接线生)   2016-01-29 04:49:00
对对,我不是怀疑这个架构有往上学的能力,只是我不会认为MCTS的随机性就足以让这个学习有无限往上的能力,它还是会落到Local Max里面,只是好的方法可以落到更高的Max
作者: aaaba (小强)   2016-01-29 04:52:00
同意楼上两位的看法,每次看论文都会感叹Google的人就是能tune出好的结果,自己就是一直鬼打墙…
作者: ddavid (谎言接线生)   2016-01-29 04:52:00
Abstract中有一句“Without any lookahead search”,这个会有一些帮助,不过这评估函数就要更精妙了XD事实上Without any lookahead search这件事正是Google的拿手好戏,用资料量压死你,谁管什么细节背景知识这招XD只是这边评估函式要是只取最终胜负就一定会大量埋没妙手,所以我想精华会在他们的优劣评估方式了
作者: aaaba (小强)   2016-01-29 05:00:00
(其实那句话是指tree search,你讲的似乎是domain knowledge)
作者: BigShotBob (BigShotBob)   2016-01-29 05:01:00
看新闻google会跟韩国棋手合作 感觉应该是可以拿到很多实战经验 三月的比赛只是个起头 未来两三年才是重点
作者: ddavid (谎言接线生)   2016-01-29 05:03:00
应该说,用背景知识去做search cut就会偏颇,所以他用完全
作者: BigShotBob (BigShotBob)   2016-01-29 05:03:00
以google的实力说不定一年就搞定@@ 当初深蓝好像也
作者: aaaba (小强)   2016-01-29 05:03:00
(他即使不用mcts,效果也还不错,但混合mcts结果更好)
作者: BigShotBob (BigShotBob)   2016-01-29 05:04:00
发展了好几年的样子
作者: ddavid (谎言接线生)   2016-01-29 05:04:00
的MCTS能让妙手出来的机会变多。可是这个问题会转嫁到事后评估某一手是否妙手上,结果是背景知识从不同的地方切入,然后我觉得后者就是能“有机会”达到更高界限但是评估更难这样不用MCTS就是彻底的从旧局学习对吧?MCTS我看起来就是提高学习上限的手法,他们实际里面有什么技术细节我不知道当然就没办法评论了XD
作者: BigShotBob (BigShotBob)   2016-01-29 05:09:00
说不定第一作者Aja Huang也是乡民
作者: ddavid (谎言接线生)   2016-01-29 05:10:00
XD
作者: aaaba (小强)   2016-01-29 05:11:00
希望三月不要同时是起头也是结尾,这样屁股还没坐热戏就演完了@@
作者: ddavid (谎言接线生)   2016-01-29 05:11:00
总之三月那战还是可以期待的是不看好直接能赢啦,就看下到什么程度了
作者: orze04 (orz)   2016-01-29 06:50:00
连环劫 交换 不断多处骚扰这些战术或许有用?这五场奇怎看怎怪 双方下得都很“平”甚至有点怀疑有作假 人类方有些棋部是连段位以下都不太可能会下出的
作者: Vick753 (彬彬)   2016-01-29 08:49:00
好猛 推个
作者: ztdxqa (ztdxqa)   2016-01-29 08:51:00
该怎么下就怎么下 堂堂正正的 不用搞战术最好
作者: aaaba (小强)   2016-01-29 12:58:00
打乱局面会先考验到自己的临场计算能力,这电脑不会怕吧,个人觉得布局阶段精心准备几把飞刀会比较有效。还没看完棋谱,不晓得电脑对引征的敏感度有没有学到位,这比较像是人会特别去检查但deep learning没有特地处理的观念
作者: tsai18 (......)   2016-01-29 14:16:00
但3月才比 这近半年时间 电脑搞不好又强了不少
作者: staristic (ANSI lover)   2016-01-29 14:56:00
蛮希望google开一个服务器让大家挑战的,以google的能力,这应该是小菜一碟
作者: aaaba (小强)   2016-01-29 15:16:00
研究人员会不会曾经偷偷放电脑到网棋上砍翻过几个P,才来约战小李
作者: angelsoul (哩囉)   2016-01-29 17:08:00
这篇不能不推
作者: para123 (好心情,事才会做好)   2016-01-29 19:52:00
看完谱心得: 台湾有好几千个世界冠军
作者: chaoyang (从创造感受生命)   2016-01-29 21:09:00
原来是Aja 他应该是台湾六段 应该也是乡民
作者: milkdragon (谢谢大家!!)   2016-01-30 00:34:00
安永吉八段讲评第一局 https://goo.gl/W9ywcU
作者: Tabrith (血糖瑪琪朵)   2016-01-30 12:49:00
好文推
作者: jerrysaikou (jerry)   2016-01-30 23:09:00
推用心分析 由这谱看来李世石必胜
作者: reflow (好想看雪)   2016-01-31 23:46:00
目前看棋谱我觉得我能赢这个电脑,但不敢说绝对必胜~"~
作者: bearching (Pandora`s Box)   2016-02-04 01:35:00
请问如果以强化学习的系统来说,如果这个目前的这个AI程度,要是开放给大量新中手下或是输入极大量新中手的谱,那这个AI理论上应该会变弱没? 另外我想是否这个AI的弱点一样在于劫争跟弃子战术的部分呢?
作者: ddavid (谎言接线生)   2016-02-04 03:33:00
输入大量新中手的棋谱会不会弱回来 → 看设计,如果没有特别设计确实有可能真的弱回来。劫争弃子是否较弱就交给比较了解AhphaGo细节的几位来答XD

Links booklink

Contact Us: admin [ a t ] ucptt.com