※ 引述《jamesho8743 (加拿大好美)》之铭言:
: 所谓人类围棋知识 是专指人类"在棋盘上"的着手 应法 思考 这叫围棋知识(不包括基本规则)
: AGZ "就算有" 建立在之前 AlphaGo的基础上 比如说要用 几层类神经网络 MCTS 或其它
: "人类工程上"的知识 但这些跟"人类围棋知识" 并不相同 基本上这个是工程问题 数学问题 主是跟棋盘大小
: 围棋规则 及围棋本质等相关的东西 而跟人类"棋盘上的着法"无关
对啊,那些推文中的质疑,都是对相关知识不了解而造成的过度猜测。
首先是终局条件和胜负判定必然要有,不然只是任意的填子,什么都不是。
围棋基本规则是判定一个点可不可以下,以及下了之后的输出结果。
以上这些都是独立的程序黑箱,没有这些东西就下不了电脑围棋,
其中 19*19*2 的步数当成终局条件,就是这样够用了,不要浪费电脑资源,
就跟电脑里的 255 或 65535 一样。
改用 ResNet 因为是最当红的神经网络模型,大家都说好,到处拿第一,
只要是做机器学习,不改来用看看才奇怪,这跟围棋一点关系也没有。
然后主程序就是通过 ResNet + MCTS 获得的数据来不断自我训练。
这几乎是一个在固定数目的位置中填入数据的通用算法,跟围棋的关系,
仅仅在于填入的位置、数据、填入数据后的变化、评估终局和成功或失败,
是根据围棋而“限定”。
换句话说,只要改上述的设定,使用这个算法可以直接变成五子棋程式,
或另外的棋,例如很多人想过把围棋改成圆环状(上下左右无边的循环),
或是三维的围棋,都可以照样修改后让电脑去自行修炼成大师。
在一些细部结构上,DeepMind 也试过不同的参数,其中比较好的结果,
才变成现在的版本,这种工程调整,跟人类的围棋知识也没有关系。
所以这不是围棋专用的算法,如果这样还要说是用到了人类围棋知识,
那就随便他了。