[新闻] 专访凤凰围棋:训练两个多月跑谱只用CPU

楼主: StressND (rmgooddd)   2018-04-30 19:40:17
http://sports.sina.com.cn/go/2018-04-30/doc-ifzvpatr4233961.shtml
“贝瑞基因杯”2018世界人工智能围棋大赛今晚闭幕,来自腾讯微信团队的凤凰围棋在决
赛三番棋中以2:1力挫老牌的王者绝艺,首次亮相世界赛就摘得了桂冠。 赛后,狮子头
迫不及待,找到了沉浸在胜利喜悦中的团队,进行了采访。
狮子头:恭喜凤凰围棋(以下金毛)获得人工智能围棋世界大赛的冠军,先介绍一下创造
神奇的团队吧。
金毛:谢谢! 很高兴接受弈客的采访。 好汗颜,我们的团队都不太会下围棋,最高水平
可能在18K以下吧(笑)。 团队的开发工程师有5位。
金毛:我们是微信AI团队的一部分。 微信中有很多AI的业务,比如语音输入法,英中互
译。 我们的主业是做微信翻译。 去年10月份,Deepmind的Zero论文发布不久,我们正好
有一些空余时间,当时我们正在做一个很大的基于云端的人工智能训练平台,支持包括深
度学习在内的各种机器学习模型,我们需要有一个东西去完善我们这个平台,同时我们也
想学一下最新的AI技术,看到Zero论文之后,我们觉得Zero的想法非常棒,正好符合我们
的想法。
狮子头:从算法层面,除了遵循“Zero”的算法,有没有其他更新的研究?
金毛:首先我们会根据TA的最基本想法,不会使用人类的棋谱进行训练。 但是我们真的
没有Deepmind那么多资源,我们没有几千个GPU,所以就回到前面说的那个基于云端
的一个机器训练平台,我们是使用微信的后台空闲的服务器资源。 当晚上微信服务器比
较空闲的时候,它就左右互搏,帮我们去生成一些棋谱。 这些服务器白天的时候是要服
务微信用户的(微信聊天、朋友圈等)。 生成棋谱基本上是由CPU服务器完成,做神经网
络的训练,还是用了那么一两台GPU服务器。
狮子头:您预测什么时候能真正达到AlphaZero最终的水平?
金毛:首先没那么多硬件资源,也不可能有那么多的资源投放进去。 其次我们需要精打
细算,做一些效率改进,提升训练的效率,因此不可能很快达到它的水平。 去年10月份
论文公布,我们开始学习,到了春节前,大约1月份开始尝试在网上进行一些实战,真正
开始大规模的训练是在大概春节后;所以我们到现在为止也就大概训练两个多月,我们见
缝插针地使用空闲的服务器,任何一台服务器忙了我们就不能使用。 在目前的状态下,
我们也很难预测什么时候能达到AlphaZero的水平。 一切还得看微信服务器的空闲资源。
狮子头:LeelaZero 已经训练了大致700万谱,每天还在不断增强。 AlphaZero总共训练
了2700万谱,你们准备训练多少?
金毛:我们的路径不太一样,我们需要提高效率,使用更少的训练量达到满意的效果。
狮子头:这个项目还会继续吗,还会继续参加AI的世界大赛?
金毛:一切都还不确定,目前我们已经达到了一个里程碑,阶段性的目标已经完成,这次
参赛本来觉得进入决赛就非常满意了,拿到冠军实在喜出望外。
狮子头:这次参加比赛之前,有没有对其他AI做一些了解?
金毛:我们所有的对局大家都能看到。 我们在明别人在暗。 别人的马甲上来打我们,也
是帮我们测试了:)。 我们需要按照一个系统工程方法,保证忠实的实现。 第一是忠实
实现;第二提高我们的训练效率,因为我们没有那么多GPU;第三就是说我们的云训练平
台要进一步完善。
狮子头:预测一下现在你的这个棋力和比如说像柯洁这样职业顶尖棋手,他们跟和你差距
有多大?
金毛:如果您观察我们公开的历史棋谱,其实上面有很多局,我们都是用一台家用的单机
在打,甚至配置比一个单卡的1080Ti还要低。 根据这些线索大致可以估计我们的棋力水
平。 实际上我们没有严格去做过类似的测试。
狮子头:今后有计划到其他围棋赛事上继续表演吗?
金毛:我们最初觉得能进决赛已经很开心了,现在拿到冠军更是意外之喜,这个目标已经
完成了。 所以下一步可能我现在也没法做一个决定,我们需要继续讨论。 我们这个团队
本来的目标也不是为了做出一款围棋产品,只是想这个机会学习学和实践AI新技术。
狮子头:现在的Block已经达到几层了?
金毛:稍候我们会详细公布金毛的一些指标,我们使用家用机的配置和职业棋手较量,如
果Block太高,机器可能根本跑不起来。
狮子头:有些AI,比如星阵,除了下贴七目半的围棋以外,可以做到动态改变贴目数。
现在大部分的AI都是根据胜率来下棋,在确保胜率的情况下,他的棋风可能会偏向退缩,
保守? 你们是不是已经储备了可以用动态贴目,包括下出这种追求极致不退让棋风等技
术储备?
金毛:我们对于星阵了解也是刚刚开始。 我们主要是做Zero的方法。 我们觉得也许人类
的一些认识跟AI的认识是不一样,没有退缩一说。 他就是追求胜利,那你胜率提高,你
说他是退缩还是不退缩呢?
作者: intointo (樱花)   2018-04-30 19:47:00
金毛:
作者: enjoytbook (en)   2018-04-30 22:50:00
应该是关于完美的定义吧,就像日本那种胜负师的说法,拼死赢越多越好。就像现在的选手,看到收官还是会选可能的完美路线
作者: linussp (行鱼)   2018-05-01 12:08:00
现在ai出货前都要先找 柯洁做benchmark
作者: tailau0 (台劳)   2018-05-02 09:57:00
Zero宝典练不到一半就冠军了
作者: wadashi1 (阿拉丁)   2018-05-02 11:26:00
收官时追求胜率提高,结果自填子,弄死自己的一块,最后变成只赢2.5 实在是人类不容易理解的追求胜率提高。
作者: Aipr (阿伯)   2018-05-02 12:52:00
因为不懂围棋所以不懂退缩是什么意思

Links booklink

Contact Us: admin [ a t ] ucptt.com