人类如何反转?人工智能专家给李世石出点招
作者:戴文渊
如果说1997年IBM深蓝战胜国际象棋世界冠军卡斯帕罗夫是机器突破了人类的第一道
防线话,2016年AlphaGo是不是摧毁了人类的最后一点骄傲呢?
虽然作为多年的AI工作者,是AI的坚定支持者,我还是觉得人类的最后一道防线可以
多坚守一段时间。那么,我来给李世石出点招吧。
这一切的一切,还是得先从AlphaGo的原理讲起。
原理:AlphaGo如何运作?
区别于国际象棋靠推演,围棋需要靠“感觉”。围棋变化太多了,每一步棋可以有多
达300多种选择。仅仅推演6-7步,就已经是现在电脑所不能及,更不用说人。所以,即便
是人,在很多场景下都要靠感觉来决定下一步往哪里走。这种“感觉”,靠的是智力。
AlphaGo基于当今最领先的“深度学习”技术,来建立机器的智力。当前的这种人工
智慧技术,是一种仿生学技术,运用数学模型去模仿人类的大脑。这种机器大脑,在面对
棋局时也可以“感觉”出情势的好坏。而“感觉”的好坏体现的就是智力水准。
那么,智力水准怎么比拼呢?通常我们数“脑细胞”的数量。就像人的脑细胞比狗多
,所以人比狗聪明;狗的脑细胞比蟑螂多,所以狗比蟑螂聪明。4年 前,Google就研发出
了一个脑细胞数量达到百万量级的大脑Google Brain,能识别出猫脸。为此Google动用了
1000+台服务器。
如果要让机器大脑更聪明怎么办?一个直接的办法就是,增加服务器。服务器数量增
加10倍,脑细胞数量就能增加10倍,机器大脑就更聪明了。
所以,AlphaGo有多聪明,主要看它有多少“脑细胞”。“脑细胞”的数量,主要看
投入了多少计算资源。
能力:AlphaGo有多厉害?
AlphaGo的智力水准肯定是不如人的。
4年前的Google Brain,脑细胞数量是人的万分之一。虽然时过进迁,但Google的投
入仍然不可能达不到当年一万倍。从第一盘比赛中,也可以看得出来,李世石在开局和布
局是占有优势的。
第一盘棋中,真正让人感到害怕的也不是AlphaGo的棋力,而是它的没有情绪、不知
疲倦、沉着冷静。这与AI无关,是机器的本性。
情绪、体力、心理波动等人性弱点对棋局结果的影响不可低估。事实上,李世石并不
输在棋力,而是输在获得优势以后的轻敌,以及之后所犯的错误。
胜机:李世石还有机会么?
双方对比来看,李世石比AlphaGo聪明,棋力更深厚。AlphaGo比李世石的人性弱点:
情绪控制更好,它不会紧张,不会沮丧, 也不会体力下降。李世石面对的其实是一位棋力比他稍差的忍者。好在,他是占
据主动的一方。在棋力占优的情况下,只要不犯错误,是可以立于不败之地的。
综合来看,我仍然看好李世石。
和AlphaGo对抗时,人类需要注意的是:
1、AlphaGo所基于的人工智能技术,强项不在于推演,而是借鉴过去见过的局面。所
以,如果要击败AlphaGo,需要尽可能把局面导向历史上没人下过的棋。
2、围棋的边角战斗靠计算,中空战斗靠感觉。既然感觉占优,那就一定要尽量把胜
负手留在棋盘中间(或许武宫正树更适合pk AlphaGo?)。靠做“势”取胜,而不是把战
火引到边角实地。
3、一旦进入到局部缠斗,尽早将局部肉搏战打完,不要留出大量小区域短兵相接的
局面,保持局面尽可能大开大合。
此外,需要格外小心的是,一定要克服自己人性的弱点。局面领先时,避免骄傲;落
后时,避免气馁;胶着时,避免紧张。
李世石如果能在后面几局注意控制自己的心魔:那么不仅可以沉着冷静,也可以小宇
宙爆发。相信后面还是有很大机会可以扳回。
总的来说,要战胜AlphaGo:
1、准备历史上没下过的布局;
2、把胜负手留在棋盘中间;
3、不留短兵相接的局面;
4、控制自己的心魔。
还有一点,可能是李世石犯的错误,但已无法改变了。据说,他要求下快棋。
AlphaGo系统的分为两个部分,一是学习,二是对弈。其中,学习的 部分是最耗时间和资
源的,而对弈部分相对计算没那么大。要限制AlphaGo,应该要限制它的学习时间,而不
是对弈时的思考时间。特别是,对于 AlphaGo这样的分布式系统,Google完全可以通过增
加一倍服务器数量来让落子速度倍增,而李世石是不可能给自己的大脑扩容的。其实,最
好的限制 AlphaGo的办法是尽早与他对弈,不让他继续学习下去 :)
据说,柯洁已经发话说,AlphaGo下不过自己了。如果柯洁要巩固自己的优势,建议
如下。
建议
1、尽早与AlphaGo对弈
2、下慢棋
3、 或者还有一个不靠谱的招,改一下规则,下20*20的棋 :)
投入:AlphaGo花了多少钱?
最后,我想一个有意思的话题是,AlphaGo到底花了Google多少钱:)
从今天双方在棋力上的差距来看,差距已经不是很大了。只要Google愿意多投入5-10
倍的资源,AlphaGo的棋力应该可以超越人类了。要达到这样的智力水准,我想Google应
该至少投入了数亿美金的资源。
随着技术水准的提升,和投入的加大,大概只需要1~2年,AlphaGo在棋力上应该也可
以超越人类。
写到这里,我其实还是很羡慕AlphaGo团队的科学家的,他们有一个很好的sponsor,
能给他们一个环境去完成一件划时代的壮举——我何尝不曾想拥有这样的环境——3年前
我和我的老师杨强提出的围棋方案找不到sponsor的场景仍然历历在目。
不过,后来我也想明白一个事情。其实我们的大环境缺的并不是有理想有抱负的科学
家,而是sponsor。所以真正挑战人类的其实是IBM,不是许峰雄;是Google,不是
DeepMind团队。就像,真正修成圣彼得大教堂的,是天主教会,而不是米开朗基罗。
这也是为什么,我决定要做第四范式————中国有好的科学家,但缺好的sponsor。
http://sports.sina.com.cn/go/2016-03-10/doc-ifxqhmvc2261479.shtml