[新闻] 天壤:对战朴廷桓只是表演赛

楼主: joanzkow (星浪)   2018-05-16 07:15:47
天壤:对战朴廷桓只是表演赛 围棋AI未来大有可期
 分文章来源:弈城围棋网
  自福州世界人工智能围棋大赛和柯洁的第二次“人机大战”之后,人工智能围棋赛事
和活动暂时告别了一个高潮,各家围棋人工智能也都纷纷在家休整,继续提高,以迎接下
一个围棋人工智能的盛会的到来。棋界纷纷也对围棋人工智能未来的发展产生联想和猜测

  天壤智慧围棋在5月26日将在杭州云栖小镇举办2050大会的活动——“天壤AI围棋论
道”。该活动也是围棋人工智能第一次大规模公开近距离与普通棋迷朋友交流的活动。那
么2050大会是一个什么样的活动?天壤围棋届时将会以什么样的形像和方式与大家交流?
天壤围棋最近发展怎么样,他们对人工智能围棋的未来有什么样的看法和规划?我们对天
壤围棋团队进行了一次专访。
  问:天壤最近发展如何?和上一次出来参加AI龙星战时相比有什么进步么?
  天壤:自从AI龙星战以后,天壤还是继续在提高自己的棋力水准。年初进行了一些线
上的测试,和多位世界冠军、全国冠军进行线上对弈,最后在15连胜之后输了,也发现了
一些过去的问题。后面就全力去进行selfplay(“自我对弈学习”)去提升自己的棋力。
2050大会的时候,天壤AI的棋力棋力肯定会比龙星战的时候强。在CGOS上,Pegasus、
Hercules这两个希腊神话人物也是我们天壤AI,在某个阶段也都相应地达到了当时CGOS的
第一名水准。这两个版本也都是低配少资源的测试版。
 问:天壤最近研发的技术路线和方案是什么?有没有做自己的一些创新和探索?
  天壤:在龙星战之前我们已经开始去探索AlphaGo的第二篇论文,也就是不需要人类
知识的强化学习方法去提升棋力的方法。限于时间,我们在龙星战的时候还是只做到了一
小部分的探索,并没有用selfplay的方法去“进化”很多轮。那么在龙星战之后我们有了
充分的时间,我们就对从“零”开始、和从人类知识开始两种selfplay“进化”的方法都
做了一些探索。在人类知识和自我进化结合的这方面我们探索得比较多,相应的也掌握了
一些关键技术可以使用人类知识去快速让其他领域的AI达到一个相对比较高的水准。
  首先,我们自己构建了一套分布式对战和训练的系统,该系统可以做到在大规模的资
源集群上自动化反复运算和训练。并且这套系统具有一定的通用性,对于资源也可以很有
效地利用,将来将作为我们天壤的所有AI业务落地应用的基础设施。天壤的分布式自动化
训练系统共包含:调度、中继资料管理、模型训练及评估、资料生成、系统监控等模组。
  其次,在模型训练方面,我们探索了一种人类资料和selfplay资料混合训练的方法,
使得模型可以忘掉人类资料中的弱招,尽快学习到selfplay资料中的妙招。同时,我们实
践了线上扩大模型容量的算法,可以保留之前小网络模型学到的知识,并无缝切换到更
大容量的模型,大幅度提升棋力。在生成资料方面,不同于AlphaGo团队拥有几千块TPU,
我们做了一些探索,尽可能利用较少的计算资源,来更有效的生成更高品质的资料。
  目前通过多方面测试,我们的系统已经达到职业九段水准。希望我们的工作可以让人
人都可以随时随地跟职业九段下棋。
  问:那么天壤未来对围棋人工智能这一块有什么计画或者是想法?
  天壤:天壤围棋今年目前为止一方面在继续提升围棋人工智能的棋力,另一方面也是
在积极构想围棋人工智能在将来能给围棋带来什么。我们在人工智能辅助围棋选手、人工
智慧围棋教学、人工智能围棋陪练等等领域都做了一些尝试。
 像今年,我们就参加了农心杯的直播解说,和女子围甲也一起举办了贯穿整年的“女子
国手
作者: abc0922001 (中士abc)   2018-05-16 08:48:00
分布式对战和训练系统,那不是 Leela Zero 吗XD

Links booklink

Contact Us: admin [ a t ] ucptt.com