这篇虽然是旧闻未曾发过在板上,个人认为值得让板友参考
AI 可以毁了西洋棋,也可以拯救西洋棋
https://bitl.to/3Wi8
从IBM的深蓝开始,到DeepMind的AlphaZero,电脑陆续征服了西洋棋、围棋等最复杂的棋
类游戏最顶尖的棋手。但电脑也在慢慢毁了这些棋类游戏——因为棋手们开始越来越依靠
死记硬背电脑的下法来击败对手,让棋类游戏失去了原先的美丽。不过,现在DeepMind团
队正在跟前西洋棋世界冠军克拉姆尼克合作,尝试西洋棋的若干变种,试图恢复棋类游戏
的美丽。
西洋棋以冷冰冰的逻辑著称,但克拉姆尼克(Vladimir Kramnik)是因为它的美丽而喜欢
上这个游戏的。
他说:“这是一种创造。”他对思维艺术在棋盘上的碰撞,复杂而优雅的挑衅和反击的你
来我往的爱好,让他在2000年击败了卡斯帕洛夫(Garry Kasparov),坐了好几年的世界
冠军王座。
尽管如此,克拉姆尼克去年还是退出了竞技性的西洋棋比赛,同时认为自己心爱的棋类游
戏已经变得越来越没有创造力了。他把其中的原因部分归咎于电脑,认为电脑缺少灵魂的
算计造就了一个规模庞大的开局和防守库,然后顶尖选手开始死记硬背。克拉姆尼克说:
“在最高层级的比赛当中,有相当一部分近半(有时候甚至整场比赛)的下法都是靠记忆
走完的。你甚至都没有自己的下法,那全都是电脑的下法。”
https://bitl.to/3WiB
在这个研究专案里面,全世界上最会玩西洋棋的电脑跟人一起玩而不是对战
上周三,克拉姆尼克就如何让西洋棋恢复一部分人类的艺术提出了一些想法,不过这需要
一个有违直觉的来源的帮忙——全世界最强大的西洋棋电脑。他正在跟Alphabet的人工智
慧实验室DeepMind合作,让研究人员向他们超人的西洋棋玩家AlphaZero发起挑战,看看
后者能不能学习选择出来的九种西洋棋的变体,进而让棋手进入到创新性的新模式。
2017年,AlphaZero 展示了自己可以无师自通,先后在西洋棋、围棋以及日本将棋中击败
了最好的电脑棋手。克拉姆尼克说,如果大家愿意对既定规则做出一些小小的改动的话,
其最新结果有望展现一幅令人着迷的西洋棋新图景。
该专案还展示了西洋棋棋手与机器之间关系的一种更为合作的模式。从事该专案的
DeepMind研究人员Nenad Tomasev 说:“开发西洋棋引擎一开始的目的是要击败跟自己下
的人类棋手。现在,我们会看到像AlphaZero 这样的系统被用于跟人类一起进行创造性探
索而不是针对他们。”
人类玩西洋棋已有大约1500年的时间,对规则的调整并不是什么新鲜事。对电脑让这个游
戏变得无聊的抱怨也不算新鲜。
大约500年前,当欧洲棋手将缓慢移动的棋子提升为如今强大的皇后,让游戏更加流畅之
后,西洋棋迅速传播开来。1996年,也就是IBM的深蓝(Deep Blue)击败卡斯帕洛夫的前
一年,变成逃亡者的西洋棋神童鲍比·菲舍尔(Bobby Fischer)在布宜诺斯艾利斯召开
了一次新闻发布会,在会上他抱怨西洋棋需要重新设计,电脑增强的记忆力应该要给创造
力让位。他推出了菲舍尔任意制西洋棋(Fischer Random Chess),这种棋保留了通常的
游戏规则,但每场比赛都要把底线那排厉害的棋子的起始位置随机打乱。这种任意制西洋
棋又叫做Chess960,后面再西洋棋界慢慢赢得了自己的小众市场,现在还有了自己的锦标
赛。
https://bitl.to/3WiD
前西洋棋世界冠军克拉姆尼克(左)正在跟Alphabet的DeepMind合作,利用人工智能探索
西洋棋的新形式。右为DeepMind的创始人Demis Hassabis
DeepMind和克拉姆尼克把AlphaZero无师自通从零开始学习游戏的能力物尽其用,想用借
助它来更快地探索西洋棋的新玩法,而不是像过去靠人类折腾了几十年甚至几个世纪才把
这种游戏的美丽和缺陷给摸清楚。Tomasev说“你当然不希望自己花了几个月甚至几年才玩会的东西却马上
意识到,‘噢,不,这种游戏一点都不美。’”
“在最高层级的比赛当中,有相当一部分近半(有时候甚至整场比赛)的下法都是靠记忆
走完的。”
——前西洋棋冠军弗拉基米尔 ·克拉姆尼克
AlphaZero 是AlphaGo 更灵活、更强大的升级版,后者曾在2016年击败了当时的围棋世界
冠军,为AI历史奠定了一个里程碑时刻。系统开始学习游戏的时候手头只有这3样东西:
游戏规则,记分方式以及预先写进程式的不断实验并赢得胜利的冲动。专案的另一位研究
人员,DeepMind的Ulrich Paquet 说:“系统刚开始玩的时候表现实在是太糟糕了,我真
想躲在桌子底下。但是看着它一步步从一张白纸演变过来的感受令人兴奋,无比纯粹。”
刚开始下西洋棋的时候,AlphaZero 并不知道可以拿下对手的棋子。但经过几个小时高速
的对抗之后,其自身的能力开始逐渐增强,跟之前的西洋棋引擎相比,它变得更加熟练,
而且在某些人看来表现更加自然。在这个过程当中,它重新发现了几个世纪以来人类玩西
洋棋的一些下法,而且还添加了自己的天赋。英国的西洋棋大师马修·桑德勒(Matthew
Sadler)表示,研究AlphaZero的下法就像“发现了过去某位伟大棋手的秘密笔记本”。
AlphaZero 测试过的九种西洋棋的替代版包括没有国王入堡版的西洋棋,这种规则克拉姆
尼克和其他人已经考虑过,并且在今年一月份举行了第一场专门比赛。这种规则取消了所
谓的“国王入堡”走法,这种走法可以让棋手把自己的王躲进由其他棋子组成的防护屏背
后——这是一道强大的防御工事,但也会令比赛变得沉闷。其他的五种变体则改变了兵的
走法,torpedo西洋棋就是其中之一。在这种西洋棋当中,兵自始至终都可以最多走两格
,而不是像原版西洋棋那样只有第一步可以走两格。
解读AlphaZero的结果的办法之一是看冷冰冰的数字。在没有国王入堡的情况下,平局跟
一般规则下法相比变少了。而学习不同的规则也让AlphaZero给不同棋子赋予的价值做出
了改变:在传统规则下,王/后的价值相当于9.5个兵;而按照torpedo西洋棋的规则,后
只值7.1个兵。
“走了三步之后,你就不知道该怎么办了。这种感觉很不错,就像自己是个孩子一样。”
——前西洋棋世界冠军弗拉基米尔· 克拉姆尼克
DeepMind的研究人员最后还是对本专案另外一个西洋棋大脑克拉姆尼克的分析更感兴趣。
Tomasev 表示:“这跟数字无关,而是从定性上,在美学上能不能让人乐意坐下来玩的问
题。” 上周三发表的一篇技术论文里西包括了克拉姆尼克对AlphaZero的探索做出的70多
页的评论。
在AlphaZero 如何适应新规则方面克拉姆尼克看到了一些美丽之处。他说,为了保证国王
的安全,没有国王入堡的西洋棋催生了丰富的新模式。self-capture西洋棋是一个更为极
端的变化,也就是棋手可以拿掉自己的棋子,结果证明这种改法更加迷人。克拉姆尼克说
,这条规则实际上让棋手有更多机会,透过牺牲一颗棋子来取得领先,数世纪以来这种走
法被认为是优雅走法的标志。他说:“总而言之,这只会让游戏变得更加美丽。”
克拉姆尼克希望,AlphaZero的这番西洋棋冒险之旅能够说服不同等级的棋手去尝试。他
说:“这是我们献给西洋棋界的礼物。” 现在也许是献礼的合适的时机。
曾两次获得美国西洋棋冠军的珍妮佛· 沙德(Jennifer Shahade)说,多年来西洋棋一
直很受欢迎,但因为新冠病毒流行很多人为了寻找新的智力刺激又热了起来。大家对
Chess960的兴趣也在增长,这表明大家对这种新型的下法产生了浓厚的兴趣,其中就包括
部分超级明星。Shahade还会为Chess960锦标赛提供赛事评论,这场锦标赛吸引了包括世
界排名第一的马格努斯·卡尔森(Magnus Carlsen) 和前西洋棋世界冠军卡斯帕洛夫在
内的一众好手。
就像克拉姆尼克一样,Shahade 认为AlphaZero测试的若干西洋棋变体有值得称道的地方
,即便类似允许兵侧向移动之类的走法感觉有点“令人费解”。如果这些新变体当中的哪
个能够发展起来的话,一些棋手仍会希望靠电脑和深度研究来取得成功,但是对周期进行
重新设置也许会令人着迷。同时也是美国西洋棋联合会女子专案主管的Shahade说: “新
玩法带来的发现会令人耳目一新,结果也许会非常令人兴奋,并令其他类型的棋手受益”
。
由于机器无与伦比,DeepMind 和克拉姆尼克的专案还可以鼓励电脑西洋棋变得更具创造
力。Eli David是以色列巴伊兰大学的研究员,他自己开发了一个基于机器学习西洋棋引
擎。他说:“与其让电脑西洋棋变得更强大,让人类显得相形见拙,不如把西洋棋变成一
种游戏艺术”。他的实验室有一名研究生正在研究西洋棋软件,这种软件会学习模仿特定
棋手的风格,这样大家就可以求助于机器,问问对方某位深受喜爱的西洋棋大师(过去或
者现在的)在特定情况下会怎么走。
克拉姆尼克的经验表明,让人与机器合作而不是对抗,不仅可以丰富这种棋类游戏的技术
体验,也可以丰富其情感体验。AlphaZero 甚至把他带到了超出其渊博知识范畴以外的地
方。他说:“走了三步之后,你就不知道该怎么办了。这种感觉很不错,就像自己是个孩
子一样。”