[问题] 想问李世石alphago第四战那一手

楼主: jane3031 (珊牛)   2018-07-20 15:21:47
本身很少在下围棋但很想知道第四战李世石对alphago那一场电脑到底是什么缺陷?
第78手时alphago预判李世石下那手的机率是0.0007
结果下了以后电脑开始乱下
我的问题是:
1.电脑之所以会乱下是因为机率太低、alphago在那样情况下的棋谱样本不够所以alphago不知道该下哪吗?
2.所以第78手以棋手来看是很笨稳输的一手吗?如果是人类棋手对人类棋手李世石第78手会稳输吗?
作者: HeterCompute (异质运算)   2018-07-20 16:41:00
电脑之所以乱下是因为他自认的前几个选点都找不到好方法,于是开始找一些对方必定得应的地方来维持胜率,但是那几手全部都是亏的,原来的问题还是无法解决,所以电脑就看起来像是在乱下导致输棋而造成的原因确实是因为棋谱样本不够以人类棋手来看,需要一些时间计算来下出正确着手强职业可能10分钟就把里面全部看清了,但如果在时间紧迫的情况下也有可能应对错误,但无论如何都不会像实战电脑发疯那样惨就是了
楼主: jane3031 (珊牛)   2018-07-20 17:59:00
所以如果是面对人类棋手而不是电脑的话是不会下出那样的78手吗?所以这样评论对吗“这场本应是稳稳的由alphago胜出,但李世石靠着人类不会犯的错的电脑漏洞而产生逆转”
作者: callpolice (宜兰拔刀斋)   2018-07-20 19:07:00
不,不会因为对方是谁就下出怎样的棋步,同样的盘面,不论对手是谁,自己想出的最佳解都是一样的
作者: HeterCompute (异质运算)   2018-07-20 19:07:00
面对人类棋手也会下78手,因为李世石也是选最复杂
作者: kenwufederer (Nash)   2018-07-20 19:07:00
对方如果是人类,小李不会这样下
作者: HeterCompute (异质运算)   2018-07-20 19:08:00
的下,这场也是应该由alphago稳稳胜出
作者: kenwufederer (Nash)   2018-07-20 19:08:00
看小李一直忍住不断就觉得心里有需影响
作者: callpolice (宜兰拔刀斋)   2018-07-20 19:08:00
除非是实力有落差要故意退让
作者: kenwufederer (Nash)   2018-07-20 19:09:00
否则对电脑来说,你从第一步就是不成立的
作者: HeterCompute (异质运算)   2018-07-20 19:09:00
应该说第四盘一开始的策略就是刻意营造出来的,所以前面对人类不会这样下,不过78手对李世石应该是唯一一手
作者: kenwufederer (Nash)   2018-07-20 19:10:00
靠BUG也是获胜,不会有人去否定那一场的胜利
作者: callpolice (宜兰拔刀斋)   2018-07-20 19:10:00
所以重点不在于是人还是电脑,而是你知道自己和对手的棋力后拟出的策略
作者: HeterCompute (异质运算)   2018-07-20 19:11:00
人类本来就会因为对手而选择不一样的下法
作者: ilw4e (可以吃吗?)   2018-07-20 19:47:00
那时候的电脑就是还没完全体,现在版的下几手就会自己投了李那手在电脑意料外原本就算得少,然后又算错就开始崩了
作者: ddavid (谎言接线生)   2018-07-21 05:30:00
用人类的说法就是,AlphaGo没排过这个定石或手筋,临场又来不及算出来所以爆破了至于为什么爆破后会看起来乱下,我在 #1P_VopGM 有做比较详细的解释一楼说“找必应的地方来维持胜率”我个人觉得不算是最正确的解释,不过以人来解读是一定程度可以那么解释
作者: HeterCompute (异质运算)   2018-07-21 06:00:00
楼上是不是搞错了?这篇专门讨论第4局78手
作者: ddavid (谎言接线生)   2018-07-21 19:42:00
我并没有搞错啊,那一挖造成的后续诡异下法本来就是这一类的问题“找必应的地方来维持胜率”这个说法是人为解读过的加料,事实上就是“维持胜率”而已,AI并不会特别去想什么必应不必应的,只不过在当下情况,饮鸠止渴的必应手刚好会是最能带来“维持现状”假象的下法而已胜率暂时掉最少就被视为是目前最佳着手而已
作者: HeterCompute (异质运算)   2018-07-21 20:30:00
“找必应的地方来维持胜率”只是描述行为结果,也没加料
作者: ddavid (谎言接线生)   2018-07-22 16:50:00
我不是说你真的讲错了,但是这句就是太过人为解读后的结果假设有一处着手对方没有必应,但是刚好胜率就跟所谓必应之处维持差不多,AI一样会去选择这个着手,它并没有刻意去选必应之处只是因为下到这种局面很有可能“只剩”必应之处不会太快掉胜率,所以才会表现出只下这些地方,因果是相反的
作者: enjoytbook (en)   2018-07-23 19:15:00
应该说电脑不会打乱局面这种下法,那时候就是被逼到没琪了却不会认输吧?
作者: ddavid (谎言接线生)   2018-07-23 19:53:00
也是理由之一。AI其实并不知道什么局面复不复杂,所以也没有什么就算胜率低但是复杂乱战的思考方向,它找不出那种人类思维中虽然并非最佳着手但可以乱战一拼的胜负手概念
作者: wadashi1 (阿拉丁)   2018-07-24 09:28:00
3天版的AG Zero跟李世石版对奕已经100盘100连胜是自己对奕而来,并非由李世石版本进化,无版本演进克制问题!是可以讨论第78手,但那也只是曾胜过李世石版的指标!真要研究,相信黄士杰博士早有答案,之前他也说过,Master跟Zero版都已克服这一手的问题,接着下都不会有乱下的状况。真要研究的话,请dp用出变化棋谱可能有些麻烦,但LZ这个免费软件,不知道有没有人拿来试过?

Links booklink

Contact Us: admin [ a t ] ucptt.com