Re: [闲聊] 科技进展对于围棋的影响 (围棋软件历史 & 突破的AlphaGo

楼主: NewYAWARA (朝霞之前奏)   2016-03-12 01:07:41
如果以电脑将棋的经验来看,
只要AlphaGo除了赢棋目标之外,多搭载形势分析、
以及步数模拟推演的机能,许多让人无法理解的走法,
一样可以变成让人易懂可学的模式。
例如我以GPS将棋(虽然现在它算弱的将棋软件)来跑2014年名人战第一局棋谱,
在第105手下完后,推估后手第106手该如何下时,
软件的分析会出现类似这样的讯息:
[-52] △2五桂(33)▲2六歩打△3七歩成(36)▲同桂(29)△3六歩打▲2五歩(26)
△2六金打▲3八银打△3七歩成(36)▲同银(28)△同角成(46)▲同金(47)
△同金(26)▲同银(38)
[282] △4五金打▲6五歩(66)△3七歩成(36)▲同银(28)△3六歩打▲同金(47)
△同金(45)▲同银(37)△4四角(35)▲3七银打△同角成(46)▲同桂(29)
△3五歩打▲4七银(36)△9九角成(44)▲7四歩打△同歩(73)▲7三歩打
△同金(72)▲3四歩打△8九马(99)▲8二角打△7二金(73)▲9一角成(82)
△4四香打▲3三歩成(34)△3六桂打▲5九玉(48)△3三金(32)
[306] △4五金打▲6五歩(66)△3七歩成(36)▲同银(28)△3六歩打▲同金(47)
△3七角成(46)▲同金(36)△5六金(45)▲同飞(76)△6七银打▲3六飞(56)
△5八银成(67)▲同玉(48)△1三角(35)
...............................
当然现在只简列上面三种,事实上还有超多种变化未列出来占篇幅,
但从中可以看出软件评估当前情势下哪一手,它距离赢棋的胜算更高。
(负值代表后手优势、正值代表先手优势)
然后出现无法理解的下法时,就直接分析它背后思考的行棋变化,
就会知道为何它会这样下。
如果对它的分析不服气,认为有更好的下法时,
我们也可以很轻易的透过盘面编辑,变成我们认为比较好的下法,
接着让它去重新分析形势,往往就会发现我们觉得好的下法,
其实只要对方在某个应手得宜,事实上这个变化是比较不利的。
而AlphaGo这次更优秀的地方在于,它的自我学习能力显然很惊人。
现有的将棋软件,即使有搭载自我学习能力,看来还是明显劣于google所写的程式。
公认最强的软件ponanza之所以强,仰赖的也不是自我学习能力,
而是设定参数最为精确,但也由于是参数,
所以还是可能出现在某些特定形势下,会由于参数设定问题而出现误判。
但这一点在AlphaGo上可能就不太会发生。
也因此,若利用AlphaGo来分析现在的对局形势、
以及展开它背后的行棋逻辑的话,理论上对职业棋士学棋应该会有帮助,
至少现在也有不少将棋棋士正在利用软件练习对局,以及借重它的思考,
研究它所分析的棋路变化,来借此强化自己的棋力。
作者: wukevinboy (wukevinboy)   2016-03-12 01:15:00
将棋王您说的分析跟我老师教我树的概念 基本上概念是一样的主要搞不太清楚这些分析概念,感谢您的回复!清楚不少

Links booklink

Contact Us: admin [ a t ] ucptt.com