※ [本文转录自 Tech_Job 看板 #1Oa83NWO ]
作者: ljsnonocat2 (平凡是幸福) 看板: Tech_Job
标题: [新闻] 人工智能战胜四位顶级德州扑克选手
时间: Tue Jan 31 20:19:33 2017
激战二十天!人工智能 Libratus 战胜四位顶级德州扑克选手
https://www.inside.com.tw/2017/01/31/libratus
在宾州匹兹堡的 Rivers 赌场,卡耐基梅隆大学(CMU)开发的人工智能系统 Libratus
战胜四位德州扑克顶级选手,获得最终胜利。
据官网介绍,此次由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和
Jimmy Chou 对战人工智能程式 Libratus,赛程为 20 天,一共进行了 12 万手牌的比赛
。
2015 年,CMU 曾组织了首场“大脑对抗人工智能”赛事。在当时的赛事中,代表 CMU 出
战的是另外一款人工智能系统“Claudico”,同样也有 4 名职业扑克玩家参加了比赛,
然而,Claudico 并未获得最终胜利。
不过 CMU 认为,当时扑克职业玩家与 Claudico 仅进行了 8 万手牌的比赛,就统计学角
度来讲并无法证明人类职业扑克玩家或人工智能具有优势。这也是本轮巡回赛中比赛的牌
局数量增加 50% 的原因。
德州扑克的玩法:每个玩家有 2 张牌作为“底牌”,同时还有 5 张公共牌。玩家选择 5
张公共牌里的 3 张,与手里的 2 张底牌组合,最后以期得到最好的 5 张牌的组合。按
照“Card Ranking”决定最后的胜者。
由于对方的“底牌”是隐藏资讯,对于电脑来说,就是在处理一种“非完整资讯博弈”。
而围棋对弈双方的资讯是完整的、对称的,并没有隐藏的资讯。Libratus 此次战胜顶级
人类德州扑克选手,具有非常重要的意义。
电脑正确决定,依赖于对方“底牌资讯”情况下的机率分布,这种“底牌资讯”可以通过
对手过去的行为显露出来。比如有时玩家采取“虚张声势”(Bluffing)的策略,对手有
时手里并没有强牌,但还是作出全额下注、志在必得的行为,电脑这时要根据对方过去的
博弈表现,来判断对手有强牌的机率。
相应的,对手也会推断我方的底牌资讯,所以这里就是一个“递归推理”(recursive
reasoning),一个玩家无法轻易推理博弈状况。
继围棋和德州扑克之后,人工智能的下一站会是哪个游戏呢?