[新闻] 黄士杰博士 远不止AlphaGo的人肉臂

楼主: zkow (逍遥山水忆秋年)   2017-06-01 15:49:47
黄士杰博士 远不止AlphaGo的人肉臂
 他面无表情,他冷静镇定,他会出现在对手的梦里,他是AlphaGo人肉臂。他热情幽默
,多才多艺。他很少登台演讲。他不被允许接受采访。他是AlphaGo真正的创造者。他是
Aja,黄士杰。
许峰雄绰号“CB”。
  1980年,许峰雄(Feng-Hsiung Hsu)从台湾大学本科毕业,1985年考入卡内基梅隆
大学。1988年,CB制造出国际象棋程式Deep Thought(深思),后来经过学弟李开复介绍
,1989年加盟IBM继续展开研究。
  1997年
  这一年5月11日,卡斯帕罗夫与Deep Blue(深蓝)的第二次国际象棋人机大战落幕,
最终人类棋王以2½-3½的总比分,不敌IBM的超级电脑。
  这是加载人类历史的一战。
  Deep Blue,就是CB许峰雄在IBM开发出的新一代国际象棋电脑程式,棋力数百倍于早
先的Deep Thought。
http://n.sinaimg.cn/kandian/crawl/20170601/kGRo-fyfuzmy0370295.jpg
△ 卡斯帕罗夫与深蓝的国际象棋人机大战
  同年7月,台北成功高中的黄士杰参加联考。当年国文试题第15题,B选项是:现代电
脑的优点多得‘罄竹难书’令人不得不叹服 。
  黄士杰最终考入台湾交通大学,四年后获得电脑与资讯科学学士。2001年,黄士杰考
入台湾师范大学攻读研究生学位。
  2003年,黄士杰硕士毕业。毕业论文:《电脑围棋打劫的策略》。在学校当了一年的
研究助理后,2004年,黄士杰再次考入师大资讯工程研究所博士班。
  2007年
  这年2月28日,台湾师范大学的学生组织了一次围棋同好聚会。随后这个定期的聚会
,发展为师大围棋社,黄士杰是其中年纪最大的学长,并担任首届社长。3月,黄士杰拟
定了首次对战分组表,比赛地点在男生宿舍地下餐厅。
http://n.sinaimg.cn/kandian/crawl/20170601/wUuV-fyfrfvv5507720.jpg
左一是师大就读期间的黄士杰
  同年5月,黄士杰带领师大围棋社参加台湾大专杯围棋赛。曾经有台湾媒体报导称黄
士杰曾经带领师大围棋社在这项比赛中夺冠。不过量子位仔细查找后发现,师范大学仅在
2009年获得过第五名,其他年份均榜上无名。
  同一赛事15个级别的个人战中,前八名也没有看到黄士杰的名字。2004-2011年间,
黄士杰一直博士在读,而他的棋力水准是业余六段。
  虽然没能在人类的围棋赛中获得瞩目成绩,但黄士杰在另一条路上继续进发。他的一
个主要战场是国际电脑游戏协会(ICGA)组织的电脑棋类程式竞赛。顾名思义,来自全世
界的电脑高手,在象棋、围棋等领域展开斗法。
  在这个比赛中,黄士杰的名字写作:Shih-Chieh Huang。
  2006年,黄士杰独自开发的第一款围棋程式AjaGo,获得围棋大赛第11名;他参与的
中国象棋程式Elephant(大象),获得大赛的铜牌。此后几年,黄士杰开发的围棋程式参
赛成绩一直没有亮眼的成绩。
  2010年
  这一年9月,哈萨比斯(Demis Hassabis)等三人在英国伦敦合伙成立了一家新公司
,名字叫做DeepMind。
http://n.sinaimg.cn/kandian/crawl/20170601/ZTMt-fyfrfvv5507725.jpg
2010年黄士杰开发的Erica击败Zen获得冠军
  同一个9月,黄士杰在Rémi Coulom的指导下,开发出围棋程式Erica,并在围棋比赛
中击败日本的Zen,获得当年的冠军。这在当时可算了不起的成就。Rémi Coulom是另一
个围棋程式Crazy Stone的作者。
  因为Erica的夺冠,让黄士杰在参加博士毕业答辩前,就已经获邀前往加拿大阿尔伯
塔大学攻读博士后,并担任电脑围棋程式的研究员。他的博士论文题目是:《应用于电脑
围棋之蒙地卡罗树搜寻法的新启发式算法》。
  2011年6月,黄士杰博士答辩通过,7月1日,黄士杰飞赴加拿大。
  此时,他后来会遇到的席尔瓦(David Silver),早于一年前从阿尔伯塔大学离开,
前往伦敦大学学院。在伦敦,席尔瓦会遇到哈萨比斯。
  到阿尔伯塔大学后,黄士杰继续研究蒙特卡洛树搜索。他还浅度参与了Fuego的开发
,这个团队里还有Markus Enzenberger、Martin Müller等人,这个围棋参加了当年的
ICGA大赛,不过可谓一无所获。
  当年11月,夺冠的还是Zen。
  时间再过一年,2012年11月,黄士杰也来到伦敦,加入DeepMind担任高级研究员。至
少从这个时候开始,黄士杰开始用新的英文名:
  Aja Huang。
  2014年初
  加入DeepMind的两年里,黄士杰似乎没有重大的研究成果。从论文发布量上看,也是
如此,2014年前几乎搜不到他发的论文。
  然而事情很快有了转机。
  2014年1月26日,Google宣布5亿美元收购DeepMind,拿下这家日后会大放异彩的初创
公司。
http://n.sinaimg.cn/kandian/crawl/20170601/taIq-fyfrfvv5507728.jpg
 △ 左为哈萨比斯,右为席尔瓦
  有一天,席尔瓦走到黄士杰面前说:“Aja,我们准备启动一个围棋项目。最开始只
有你和我”。2014年2月,AlphaGo项目正式启动,团队三个人:哈萨比斯、席尔瓦、黄士
杰。哈萨比斯是整个公司的老板,席尔瓦是黄士杰的经理。所以,这个团队真正干活的只
有黄士杰一个人。
  AlphaGo项目,就是想搞出一个强大的围棋程式。而且从一开始,这个团队就决定不
会尝试所有的方法,他们只有一个方向:沿着深度学习和强化学习的方向探索。也是从一
开始,他们就知道这是一个非常困难的挑战。
  哈萨比斯说,希望通过AlphaGo的研究,让机器获得直觉和创造力。
  而更现实的困难是,与国际象棋相比,围棋的计算空间巨大,而且电脑无法理解一盘
棋到底谁获得了胜利。
  但他们就这样出发了。
  2014年6月-2015年6月
  这年夏天,AlphaGo的第一个重要武器出现了。在卷积神经网络的说明下,AlphaGo学
习了很多人类高手的棋谱,能在3毫秒内做出比肩人类的下棋直觉。后来黄士杰给这个武
器命名:“策略网络”,并且持续进行训练优化。
  这个时候,AlphaGo的训练还是在GPU上完成的。
  时间再过一年。2015年6月,AlphaGo拥有了更强大、分布式的搜索技术支援。阅读棋
局的能力大幅提升,可以检索多种局面变化,并且找到最佳的应对方式。这个时候的
AlphaGo,可以算出后续40-60步棋。
  (量子位注:击败柯洁的最新版AlphaGo,也只算到50步棋就停止了。)
  当时在相同的硬件条件下,AlphaGo对另一个围棋程式Crazy Stone取得了70%的胜率
,换句话说棋力领先了一个子。这个成就让整个DeepMind都很受鼓舞,哈萨比斯这时候对
黄士杰说:
“Aja,咱们要组一个团队,你不用再单打独斗了”。
  从这时候开始,逐渐有更多的深度学习工程专家加入AlphaGo团队。黄士杰还为新加
入的同事办了一个训练班,普及基本的围棋规则。
http://n.sinaimg.cn/kandian/crawl/20170601/SGxO-fyfrfvv5507733.jpg
黄士杰
  2015年8月
  与此同时,另一个重要的节点已在不远。两个月后,AlphaGo将掌握称霸围棋世界最
关键的能力:形势判断。
  “事实上,形势判断是围棋过程中最难、最令人头疼的环节,要进行准确的判断,必
须具备精确测算双方目数的能力,同时还要兼备综观全域的大势观、挖掘潜在价值的分析
能力和推理能力……要下出真正具有水准的围棋,形势判断十分必要。”
  上面这段话,来自李昌镐。这位绰号“石佛”的韩国棋手,从1992年夺得第一个世界
冠军开始,到2007年为止共获得18次个人冠军、13次团体冠军,开创了“李昌镐时代”。
  AlphaGo如何获得形势判断的能力?
  解决这个问题的人是席尔瓦。有天他对黄士杰说:“Aja,我有一个主意,我觉得可
能会管用”。席尔瓦的主意后来被称为“价值网络”。当时黄士杰对这个主意非常怀疑,
他回复说:“能管用么?咱们试试吧。”
  价值网络也是一个卷积神经网络,输入是落子位置,输出0-1之间的数字,0代表对手
胜利,1代表自己胜利,如果差不多就输出0.5。(量子位注:Google最近公布的数字是
-1~1,略有不同)。
  总之,AlphaGo通过自我对弈,训练出价值网络,进而可以判断每一手棋背后代表的
胜率。这就形成了形势判断的能力。
  价值网络的出现,让AlphaGo棋力突飞猛进。与Crazy Stone的对弈中,AlphaGo胜率
达到95%,也就是达到让两子的水准。
  “当时AlphaGo已经可以碾压我了,我已经感觉到它的强大”黄士杰回忆说。
  2015年10月
  也是8月,樊麾在参加欧洲围棋大会,回到法国的家中。他收到一封电子邮件,寄件
者是AlphaGo团队的Maddy。邮件内容非常简单:我们是一家伦敦的公司,希望邀请你来我
们公司。也没有更多资讯。
  樊麾一度认为是垃圾邮件。但鬼使神差,他回了邮件说:“可以呀”。然后他们用
Skype进行了线上沟通,席尔瓦当时也参加了,他们给樊麾讲述正在做有趣的专案,也讲
述了自己是一家Google收购的公司。
  随后樊麾上了DeepMind的官网,确定有这么一家公司,以及公司主页上还提到了围棋
的字样。于是他下定决心过去看看。
  双方第一次见面是9月底,当他确定自己要跟一个围棋程式对弈时,整个人一下就放
松了,心说:“对付一个软件,还不分分钟的事儿”。樊麾当时甚至跟AlphaGo团队表示
,他跟AlphaGo的下棋时间,只需要一个小时就够了。
  当时黄士杰反复跟樊麾说AlphaGo很厉害。但樊麾根本听不进去。
http://n.sinaimg.cn/kandian/crawl/20170601/fdj5-fyfuzpn2355721.jpg
 △ 最后一局樊麾为自己的失误懊恼不已
  2015年10月5日-9日。樊麾再赴伦敦,跟AlphaGo大战五回合,当时代替AlphaGo落子
的就是黄士杰本人。结果可能大家都知道,樊麾全输了。“当时我的整个围棋世界都崩溃
了。”樊麾说。
  和樊麾的比赛结果,DeepMind一直到2016年初才对外发布。那时樊麾已经受聘成为
AlphaGo的教练。公布赛果那天,樊麾关闭了手机。外出买菜的樊麾妻子给家里座机打电
话:“千万不要上网看评论,说的可难听了。”
  聂卫平当时评价说:“樊麾水准太低,给我们丢脸了。”
  2016年
  1月27日,《自然》杂志以封面论文的形式,介绍了DeepMind团队开发的AlphaGo,以
及它击败了欧洲冠军樊麾的消息。
  席尔瓦和黄士杰,并列作为这篇论文的第一作者。
  在击败樊麾之后,AlphaGo的价值网络、策略网络和搜索能力都在继续增强,使用的
硬件也从GPU换成TPU。TPU让AlphaGo的计算能力获得极大提升。
  3月9日-15日,AlphaGo和李世石大战五场。最终AlphaGo以4:1取得胜利。当时坐在
李世石对面,代替AlphaGo落子的还是黄士杰。
http://n.sinaimg.cn/kandian/crawl/20170601/mxR_-fyfuzpn2355741.jpg
左一为黄士杰,中间坐着的是樊麾
  黄士杰第一次出现在全球观众的视线里。
  黄士杰像机器人一样,出现在李世石和全球观众的视线里。
  李世石后来回忆说:“黄士杰是此次人机对弈中最辛苦受累的人,他担心我会受到影
响,对弈期间,他一直面无表情,甚至连一次洗手间都没去过”。
  一次对弈,最长可能耗时近6个小时。在与李世石的无论对弈中,黄士杰只喝过一口
水。黄士杰的这种表现,甚至走进了对手的梦里。
  有次酒店的早餐送来后,李世石的妻子唤醒他起来吃早饭。没想到李世石竟然回答说
:“嗯,我要和Aja一起吃。”
  与李世石的比赛之后,黄士杰有过短暂的休假,几乎没有采访报导留下。一位元名叫
Fred Zhou的中国记者告诉量子位元,在韩国比赛期间,黄士杰并不被允许接受采访,据
说是因为他习惯于表达的毫无保留。
  再后来DeepMind放出了棋谱,AlphaGo继续新的成长。这年11月18日,黄士杰总结说
:“最近我的一个心得是,人的进步最多是用跑的,电脑的进步却是用飞的”。
  在这一年即将结束的时候,AlphaGo又回来了。2016年12月30日,Science News发布
了一条推特,基本跟内文无关,推文如下:
AlphaGo: “Now, I am the master。”
  2017年
  事情从2016年12月29日晚开始,一个用户名为“Master”,标注自己是韩国九段的棋
手,连续在弈城和野狐围棋平台大杀四方,连续“斩杀”各路围棋高手,包括:柯洁、朴
廷桓、井山裕太、陈耀烨、申真谞、常昊、古力、周睿羊……
  Master挑起的这场战斗,以60连胜顶级高手而告终。其中柯洁连输三场,期间因为急
性肠胃炎而人生第一次住院,这一经历也被编成调侃的小段子。
  取得第59场连胜之后,Master在聊天室公布了自己的身份:“我是AlphaGo的黄博士
”。果然是AlphaGo,果然又是黄士杰。
http://n.sinaimg.cn/kandian/crawl/20170601/U_T8-fyfuzpn2355745.jpg
黄士杰自报身份
  “非常期望今年能有机会与围棋组织以及专家共同探索围棋,在相互启发的气氛中共
同领会围棋的奥妙。我们希望尽快发布其他公告”,哈萨比斯在稍后的正式声明中说,这
再次暗示了AlphaGo与柯洁的大战即将进行。
  4月10日下午三点,在中国棋院的发布会上,正式宣布柯洁与AlphaGo的人机大战5月
底开打,柯洁当时表态会不惜一切手段与AlphaGo一决胜负:“我不会说输了无所谓,我
抱有必胜的心态和必死的信念”。
  5月23日,雨从早下到晚,围棋人机大战如期举行。柯洁对面,坐着的仍是黄士杰,
仍然作为AlphaGo的人肉臂代为落子。
  柯洁旁边的桌子上,除了一个水杯,还有两盘水果和零食。而黄士杰这边的桌子上,
只有一个白色的瓷质水杯。三场比赛皆是如此。
http://n.sinaimg.cn/kandian/crawl/20170601/L3eY-fyfuzny1696036.jpg
双方对弈的最后一局
  每场比赛结束后,黄士杰都会很快的从对局室,返回现场的观赛大厅。但他只是静静
的站在一个角落,低头看着自己的手机,有时朝台上看看,等待柯洁等人站在聚光灯下,
而身材不算高大的他时常会被身边的人挡住。
  第二场对战结束后,柯洁在台上谈起黄士杰:
“黄博士作为AlphaGo的核心人物,非常了不起。我觉得,他坐在我面前就像个机器
人一样(笑)。如果是古力坐在我对面,他可能看到AlphaGo的下法可能会露出惊讶的表
情。”
“黄博士来摆棋,可能更让我有和AI对战的感觉。我也特别佩服黄博士,大家看直播
也能看到我很爱动,总喜欢活动身体,而黄博士总是一动不动,不上厕所、不喝水、也不
吃东西……所以跟黄博士下棋时,我觉得黄博士就是AlphaGo。”
  当时哈萨比斯也说:“黄博士非常不可思议,有时候我们也觉得他是个机器人。我想
他之前一定对着镜子练过”。
http://n.sinaimg.cn/kandian/crawl/20170601/VfsL-fyfuzny1696041.jpg
 “最后一局即将开始,我要亲手下出AlphaGo的每一步棋”,人机大战最后一天的上午9
:35,黄士杰在朋友圈发了这样一句话。
  量子位当时就有一种异样的感觉。一是黄士杰从来没有在赛前发声,二是这话里明显
有着隐忍而又强烈的情绪。
  最后一战,柯洁一样情绪强烈。
  那天下午1点06,对局中的柯洁摘下眼镜,神情沮丧。两分钟后,柯洁起身离席。代
替AlphaGo落下第127子的黄士杰博士,赶紧拿起杯子喝了一口水。随后黄士杰又恢复平静
的表情,一直低头看着棋盘。
  时间过了很久,离席的柯洁还没回来,黄士杰也开始抬头张望。十多分钟后,柯洁终
于回来。后来我们知道,柯洁躲在现场的宣传板后,哭了。
  下午1点22分,柯洁又抹了抹眼角。此时双方行至第129手。
  经过209手的交锋,柯洁再负AlphaGo。
  “其实今天下棋的时候我有点失态了,因为它(AlphaGo)下得实在是太完美了……
我只能猜得出它一半的棋,这就是我和它之间巨大的差距”,赛后柯洁在台上哽咽讲出最
后一战的感受。
  稍后不就,同在台上的哈萨比斯表示,AlphaGo从此“退役”。这时量子位才多少理
解了黄士杰早上那条朋友圈的意义。
  上述种种发生的时候,黄士杰就坐在台下第一排,正中间的位置,抬着头静静地听着
。看不到他有什么表情,也看不到有什么动作。也仍然没有上台发言的机会。有媒体靠近
,黄士杰仍是那句:他们不让我接受采访。
  5月28日凌晨0:34,黄士杰在朋友圈发出这样一句话:“天下没有不散的筵席,我转
往其他专案的时刻已到”。
  一切就这样收官了。
  这是加载人类历史的又一战。
http://n.sinaimg.cn/kandian/crawl/20170601/iGsS-fyfuzmy0370375.jpg
 最后
  “这几年,特别是来到英国工作之后,有时候我觉得人生就像做梦一样。在团队与同
事们的身上,我也看见了人因梦想而伟大的真实意义”,年初有同事问黄士杰以前研究电
脑围棋时有没有想到今天,他写下这样一段话。
  从开始到现在,黄士杰看着AlphaGo的出生、成长、名满天下。黄士杰一直以AlphaGo
人肉臂的样子出现,像一个机器人一样。
http://n.sinaimg.cn/kandian/crawl/20170601/4U82-fyfuzmy0370380.jpg
 但黄士杰,远远不止是AlphaGo的人肉臂。
  他也绝不是一个冷漠无趣的机器人。
  不信你听听下面这首黄士杰弹的乐曲,这是黄士杰初二时从音乐班转学后创作的。在
音乐课的前一晚,黄士杰准备了这首曲子。
http://sports.sina.com.cn/go/2017-06-01/doc-ifyfuzym7534553.shtml
难得中国这么详尽的报导黄博士,还写得文采并茂挺不错的
作者: yys310 (有水当思无水之苦)   2017-06-01 15:51:00
好长篇的报导
作者: sarraya (~ No Game No Life ~)   2017-06-01 15:58:00
为什么要把联考题的选项也都挖出来,又不是没料可写 = ="
作者: chigi (  )   2017-06-01 16:07:00
作者: stfang925 (司马铃薯)   2017-06-01 16:29:00
整个求学生生涯都在专研围棋AI 在最后划下完美的句点最后一段看了很感动 希望在Alphago转型之后黄博士可以继续保持下去
作者: seaEPC (没看见,我没看见 >_<)   2017-06-01 16:34:00
不知道未来Aja有没有能畅所欲言的机会
作者: aegis43210 (宇宙)   2017-06-01 16:38:00
人因梦想而伟大
作者: defendtextbk (一条线)   2017-06-01 16:59:00
哭惹
作者: gamera (gamera)   2017-06-01 17:01:00
作者: jaw13 (jaw)   2017-06-01 17:04:00
作者: nendi (米迪)   2017-06-01 17:15:00
人因梦想而伟大!
作者: iandddy0986 (Pseudotensor)   2017-06-01 17:19:00
推!!
作者: arthurwang (莫言)   2017-06-01 17:21:00
能看到AG这些精彩的棋谱,真的谢谢黄博士
作者: henry1915 (henry)   2017-06-01 17:24:00
感人
作者: blacktom (泉)   2017-06-01 17:51:00
推黄博士,好感动啊
作者: intointo (樱花)   2017-06-01 18:17:00
看到一开始是他自己摸索 我觉得我要坚强…
作者: rekku (Void)   2017-06-01 18:18:00
黄博士的精神正是将理想转化为现实的道路!
作者: josephlu0404 (Mashiro)   2017-06-01 18:45:00
泪流满面
作者: MonkeyCL (猴总召)   2017-06-01 18:57:00
AjaGo听起来好可爱
作者: horseham (给我水球)   2017-06-01 19:04:00
这群人对于围棋求真的态度 不输给任何一位职棋
作者: devidevi (蜜蜜)   2017-06-01 19:27:00
这间公司只有三个人,一个是老板,一个是经理,实际上做事的只有一个人,好想哭...
作者: FantasyNova (F.N)   2017-06-01 19:33:00
老板跟经理有它们要做跟负责的地方...
作者: jhan6301   2017-06-01 19:58:00
推好文
作者: a2156700 (斯坦福桥)   2017-06-01 20:01:00
Aja,咱们要组一个团队,你不用再单打独斗了 QQ
作者: zeat (L.)   2017-06-01 20:14:00
这个团队真正干活的只有黄士杰一个人XDD
作者: stevengoddy (过去过不去)   2017-06-01 20:19:00
推 可以收藏了
作者: ssnneqay (报废主机)   2017-06-01 21:03:00
最后一局开始前的那句话好伤感,就好像是亲手牵着自己的孩子走完最后一程
作者: william12tw   2017-06-01 21:37:00
感人@@
作者: aspwell520 (Gadabout)   2017-06-01 21:40:00
推黄博士
作者: kk2025 (kk2025)   2017-06-01 21:50:00
作者: Lamuneforty (ラムネス)   2017-06-01 21:54:00
感动推
作者: Yz (努力)   2017-06-01 22:16:00
好棒的文
作者: newtonyd (newtonyd)   2017-06-01 22:54:00
个人觉得写的很好啊
作者: Kydland (RBC)   2017-06-01 22:57:00
黄博士是台湾人 台湾的媒体到底在干嘛...... 烂死了新创公司差不多都是这样 老板负责social找钱中阶干部才是管理者 做苦工的又是另一批
作者: airflow (享受压力)   2017-06-01 23:05:00
AlphaGO 知道自己的命运 所以最后一盘就大开杀戒了?
作者: Kydland (RBC)   2017-06-01 23:07:00
这就和当年革命党一样 真正在做事的是黄兴 孙文负责嘴砲
作者: hochirijay (uni)   2017-06-01 23:16:00
如果柯洁能真的赢一盘也许研究就会继续,无奈真的差太多了
作者: Lindeman5566 (德曼56)   2017-06-01 23:32:00
好励志啊 QQ
作者: AirOctopus (AirOctopus)   2017-06-01 23:35:00
所以Kydland想要台湾媒体干麻?报导黄世杰吗?不是报导很多次了? 所以到底要干麻?
作者: Kydland (RBC)   2017-06-01 23:37:00
报导的水准不高啊 尤其这次的着墨程度不比去年整天在那边报爱赌博欠债拖累自己的女儿 却死不认错 一句诚恳的道歉都不说 硬想要上台献花的猪哥亮
作者: GHowPan (豪洨)   2017-06-01 23:52:00
所以AG能算是混血儿吗?
作者: RicFlair (Figure-four Leglock!!)   2017-06-01 23:57:00
真详尽
作者: CGary (下雨天也挺浪漫的)   2017-06-02 00:01:00
David Silver提出了价值网络, 虽然Aja功劳很大, 但把Silver说成是一个经理, 不干活的角色... 实在是有点太过吹捧...而且Hassabis本人也是产业专家 也是个会动手的人 并不是只有老板这么单纯 在这产业我常遇到一些小公司 被大公司收购前 整个公司都是博士 全部都是能打的 老板会参与到每个细节并不是每个新创公司都“差不多是这样” 尤其这种高强度的技术性创业 老板没料根本搞不定下面的人...只是他们负责的事通常较多 在专案的时间不可能有aja多而已
作者: ykes60513 (いちご)   2017-06-02 03:07:00
Silver不知帮了多少 前期应该不是code都Aja写的吧能提出价值网络 代表他对程式应该也蛮了解的才是
作者: H45 (!H45)   2017-06-02 07:16:00
Aja很早就在网络上自称Aja了,新闻多少还是有些误差,须留意
作者: sunev (Veritas)   2017-06-02 09:08:00
都与黄士杰并列论文的第一作者了,说只是经理实在是还有是李开复不是李开复,转新闻至少要自己看过一遍吧
作者: AirOctopus (AirOctopus)   2017-06-02 10:04:00
还报导水准不高咧,这篇是有多高?这次人机本来世界就没什么关注,再报导同样的人一次是要干麻?而且猪哥亮本来就是名人,不报导他发生什么事才奇怪而且你以为中国没有整天报导奇怪的东西?别幻想了还可以花整篇新闻污辱人水准真高XD
作者: hdjj (hdjj)   2017-06-02 10:26:00
推,黄博士愿意的话,应该有一大堆人抢著找他继续研究围棋只是没有Google的资源和环境的话,也很难有如此伟大的成就
作者: blacktom (泉)   2017-06-02 10:39:00
干嘛继续研究围棋,他在深度学习的领域可以有更多其他贡献
作者: Microyanke (Gogo)   2017-06-02 10:52:00
作者: LeeSeDol (啧啧...)   2017-06-02 11:12:00
从赛后记者会看得出D. Silver的贡献应该是不输给任何人。他是知道研究方向朝哪边去才有成果的人。看看新论文的第一作者是谁吧!我猜是Silver独居,毕竟他在reinforcement这块是专家,这是AlphaGo棋力继续提升的关键
作者: ztdxqa (ztdxqa)   2017-06-02 12:00:00
Silver在RL这块无人不知无人不晓啊 他师父Sutton就是RL那本圣经的作者啊 把他说成经理实在是很好笑黄博士或许是蒙地卡罗的专家 但AlphaGo能真正胜过人类的关键是DRL D.Silver才是关键中的关键
作者: Lordaeron (Terry)   2017-06-02 14:51:00
aja的论文就是RL 了, 有人看过?Silver在RL这块,有几人知晓,要统计一下囉.但aja 的论文是RL,看来没人知呢.
作者: ztdxqa (ztdxqa)   2017-06-02 14:54:00
惊 真假 哪一篇啊?
作者: Lordaeron (Terry)   2017-06-02 14:58:00
假的!!他又不是"大师". 更是无人知晓的.他的就是MONTE CARLO而已, 教你怎么蒙赢ZEN
作者: CGary (下雨天也挺浪漫的)   2017-06-02 15:55:00
D.Silver是不是无人知晓我不确定 但他恩师是产业大咖倒是没什么问题,他跟他老板Andrew Barto可以算是学阀一支...至于aja的博士论文不难找到:"应用于电脑围棋之蒙地卡罗树搜寻法的新启发式算法", 那时alphago 横空出世就下载来看
作者: Lordaeron (Terry)   2017-06-02 16:03:00
哪有看到调参数?
作者: CGary (下雨天也挺浪漫的)   2017-06-02 16:05:00
完 或许我才疏学浅 看不出MCTS SB 跟 RL 的关系... 不过aja对RL有涉猎不奇怪 以算法为业的人都是跳来跳出找题目做的另外, 其实我对 Silver 最记得的倒不是alphago,而是atari
作者: lwei781 (nap til morning?)   2017-06-02 16:11:00
V18 ~ V25 差最多的是RL???然后只算到50步后 cut? 那Zen/绝艺 有机会超越
作者: CGary (下雨天也挺浪漫的)   2017-06-02 16:13:00
这个目前没人真的知道 这个value network 可能有不小的调整反正DM丢出来后 会有很多产业界的人会动手把它弄出来...
作者: lwei781 (nap til morning?)   2017-06-02 16:25:00
其实就算是V18 似乎都有东西比绝艺强还是有找出 Value 和 Strategy Network 可以互动的部分??其实希望还是在Zen, 应该至少会把他们能理解的部分处理
作者: wadashi1 (阿拉丁)   2017-06-02 16:38:00
我关心的是AlphaGo围棋的部份是所有版本就此关机完结,还是纯粹不公开而已,然后继续耗电,在非公开继续成长?
作者: Lordaeron (Terry)   2017-06-02 16:39:00
单纯MCTS 只会乱下, 加个SB 好一点,但没TRAIN下来,你SB 的参数也随机?
作者: wadashi1 (阿拉丁)   2017-06-02 16:40:00
aja这生都奉献给电脑围棋了,就此断结,实在可惜..
作者: blacktom (泉)   2017-06-02 16:50:00
他才几岁...讲成这一生都奉献给围棋也太奇怪,而且围棋本来就是人工智能发展过程的一个课题而已
作者: intointo (樱花)   2017-06-02 17:32:00
如果把其他AI领域的技术带回围棋 阿老师也算是在成长
作者: aegis43210 (宇宙)   2017-06-02 17:51:00
嗯,楼上+1,期望阿老师能成为真正的围棋上帝
作者: lwei781 (nap til morning?)   2017-06-02 18:33:00
可能没全关机 但是没新算法idea 可能不会狂跑
作者: ddavid (谎言接线生)   2017-06-02 18:58:00
别再以为做电脑围棋的就一辈子只会只能做电脑围棋了XD这个领域的可转移性很高的,跟不同的背景知识合作马上又是新应用只是说Aja针对电脑围棋一定会有特殊的感情,所以要转移也难免有所感伤XD
作者: lwei781 (nap til morning?)   2017-06-02 20:16:00
Aja 做些其他的搞不好可以学到东西或灵感回来加强狗
作者: fishinthesky (在空中的鱼)   2017-06-02 21:02:00
好文推
作者: devidevi (蜜蜜)   2017-06-02 22:53:00
以前系统写死的话,是真的有这个可能但是现在写的是自我学习,核心不变的情况下,修改条件..可以适用其他环境,这才是自动学习最大的功能
作者: Boyzone (Boyzone)   2017-06-02 23:15:00
作者: ckuser (风建时代)   2017-06-03 00:25:00
该不会小李那一挖 也间接促使阿发狗的进化
作者: ddavid (谎言接线生)   2017-06-03 07:36:00
不是该不会,事实上就是那一手同时能列入围棋史册跟人工智能发展史册了
作者: bidodu (用食物纪年)   2017-06-03 10:30:00
祖国媒体创作乡民也能高潮,根本没访问本人呵呵
作者: jacky7987 (忆)   2017-06-03 11:25:00
看完好感人喔
作者: aks4751   2017-06-03 12:51:00
第一段我以为在看食神
作者: Edaw (Wade)   2017-06-03 15:09:00
推Aja参与了制作上帝 根本是其他人一生都无法达成的成就人工智能历史有他的一笔
作者: cartoonss (最上小恭)   2017-06-04 19:49:00
真希望以后可以有Aja的专访!
作者: lwei781 (nap til morning?)   2017-06-04 20:44:00
中国用长江学者挖他的话应该会有专访
作者: Kydland (RBC)   2017-06-14 01:52:00
某人只会在那边崩溃 笑死人了 加油好吗大家来关注围棋有什么不好 难不成关起门来取暖吗真的是笑死人

Links booklink

Contact Us: admin [ a t ] ucptt.com