[问题] 可否更改alphago的设定 benjamin1169 PTT批踢踢实业坊

[问题] 可否更改alphago的设定

楼主: benjamin1169 (阿呆名) 2016-03-10 23:53:40

其实现在很明显可以看出来
基本上alphago可以控制胜率最高的着法赢7目以上
但这样我们无法知道alphago真正的实力
是不是可以改成让两颗或60%胜率以上的情况追求最大目数呢？
这样会不会更有看头
不然未来棋手都是被慢性屠杀
看了也挺难过唉

作者: Senkanseiki (戦舰栖姫) 2016-03-10 23:57:00

这个的说法只是在问让几子而已阿...

作者: sky0302 (free) 2016-03-10 23:57:00

想太多是小李下得臭不是AI有多强

作者: zelkova (*〞︶〝*) 2016-03-10 23:58:00

让两颗XD

楼主: benjamin1169 (阿呆名) 2016-03-11 00:02:00

我必须很客观的说....两边棋手的内容完全是不是不同水平....棋城8d 不会下棋应该还是会看一些xD

作者: sky0302 (free) 2016-03-11 00:06:00

楼上我也棋城8d 很明显这两盘不是小李的水平呀AI的棋没有到让我看不懂或害怕的地步甚至有些是一看就啥这下得出手.....

楼主: benjamin1169 (阿呆名) 2016-03-11 00:10:00

最可怕的就是它已经快赢了才下的出来你看的懂的啊毽如果一开始就让两颗下法就不一定一样了如果今天alphago被让两颗或落后中间白棋说不定就被屠了

作者: sky0302 (free) 2016-03-11 00:12:00

其实根本没那么神棋圣也是一手一手下反正我是放心了AI的棋力不可能超过我所认知的棋圣水平

楼主: benjamin1169 (阿呆名) 2016-03-11 00:14:00

就像alphago有可能是已经胜定樊灰才下臭棋另一版的电脑对上alphago胜率77%

作者: a1223356 (京) 2016-03-11 00:16:00

给世界顶尖棋士让子，你要让他们失业吗？

作者: mothertime (我超爱傅红雪这变态) 2016-03-11 00:18:00

这版已经是分布式的了，不是单机版

作者: ilw4e (可以吃吗？) 2016-03-11 00:18:00

其实客观说两盘到中盘前李都有优势或平局，电脑可怕的是后半几乎不会有失误

楼主: benjamin1169 (阿呆名) 2016-03-11 00:20:00

平局是我们看的....转播也是一堆错误说不定alphago早就判定赢10目提早收工了

作者: ilw4e (可以吃吗？) 2016-03-11 00:25:00

有些棋好坏很明显的不能结果论，两盘的左下角电脑选的变化都不会是好棋，不能说它最后因为李的其他失误赢了所以就对

作者: lwei781 (nap til morning?) 2016-03-11 00:26:00

不是好棋但是不影响胜负对AlphaGO 来说没差的

作者: ilw4e (可以吃吗？) 2016-03-11 00:28:00

不影响胜负只是因为人类之后犯的错更严重阿:D

作者: NaoGaTsu (那欧卡兹) 2016-03-11 00:29:00

这件事就值得深思了。不影响胜负的臭棋真的臭吗？对阿发狗来说，人类犯不犯错都无关他“上一手”的运算啊阿发狗也算不出人类下一手会犯错，因此人类犯错是人类的事，阿发狗计算的只有当前“该怎么下胜率最大”。

作者: ilw4e (可以吃吗？) 2016-03-11 00:34:00

我的意思是赢电脑不是没机会，像昨天中盘李领先，不管人或电脑来判断应该都一样，所以电脑才需要打入那手不然若电脑觉得自己优势应该要下些简明棋更高机率迈向胜利

作者: lwei781 (nap til morning?) 2016-03-11 00:36:00

没欧第一盘电脑一直都当102 是他的权利, 看看Zen的分数第一盘的80 应该就是准备 102 的下法

作者: ilw4e (可以吃吗？) 2016-03-11 00:37:00

别说zen了，两个程式等级差多少:D zen判断够强就换他来打了102后如果李处理较好也还是优势

作者: broodworld (john) 2016-03-11 00:45:00

要看对手等级搂,李世石对我下臭棋也不影响胜负阿而且不影响胜负也是中后盘强,前面有乱下本钱

作者: NaoGaTsu (那欧卡兹) 2016-03-11 00:49:00

所以说，臭不臭棋要看当下的盘势，若以盘势论，阿发狗抓准高胜率的方向下，只要胜率高，就不算臭棋不是吗？

作者: broodworld (john) 2016-03-11 00:51:00

还是臭啊,因为盘上可选胜率看起来差不多,就是判断不好

楼主: benjamin1169 (阿呆名) 2016-03-11 00:52:00

102之后谁都看的出来黑棋大劣了实战是最佳解

作者: NaoGaTsu (那欧卡兹) 2016-03-11 00:52:00

以胜率论的话，我们觉得差不多，阿发狗计算上可能不是这

作者: broodworld (john) 2016-03-11 00:52:00

越后面当然越好,跟人刚好反过来

作者: liaon98 (liaon98) 2016-03-11 00:53:00

不是当下胜率最高而是当下AlphaGo能算到的最高胜率

作者: NaoGaTsu (那欧卡兹) 2016-03-11 00:53:00

youtube转播者好歹也是日棋九段，盘势不太可能看错吧阿发狗那一手能算到的最高胜率对其而言不就是胜率最高？

作者: broodworld (john) 2016-03-11 00:54:00

阿发的胜率分布会随进行提高,不然前6手胜率不会差太多

作者: liaon98 (liaon98) 2016-03-11 00:55:00

呃阁下刚刚没有讲“对其”啊

作者: NaoGaTsu (那欧卡兹) 2016-03-11 00:55:00

我有打“阿发狗”啊 XDD

作者: broodworld (john) 2016-03-11 00:56:00

我是怀疑有套手,有套手时往往有更加解,电脑会选更加如果阿发从头赢到尾,有需要放胜负手吗

楼主: benjamin1169 (阿呆名) 2016-03-11 00:59:00

世界排名第四都输了......在alphago面前任何普通职手形势判断都不能说正确吧确实在102之前我也是认为黑好的后来才发现是假象

作者: NaoGaTsu (那欧卡兹) 2016-03-11 01:00:00

呃，若是如此的话，那怎么说102之后谁都看得出来黑棋大劣 = =

作者: lwei781 (nap til morning?) 2016-03-11 01:04:00

Zen 下不了前段, 但是后段的valuation 应该很接近

楼主: benjamin1169 (阿呆名) 2016-03-11 01:04:00

我认为大家对于102前的形势判断是错的

作者: liaon98 (liaon98) 2016-03-11 01:04:00

评论是说115有点缓让116占到形势就歪过去了

作者: lwei781 (nap til morning?) 2016-03-11 01:05:00

78, 102 应该很早就在AlphaGO 考虑的Tree 里了

作者: liaon98 (liaon98) 2016-03-11 01:05:00

123让白活整个角也被评不佳

作者: lwei781 (nap til morning?) 2016-03-11 01:08:00

72, 74, 76 时大概就已经有算出来了

作者: NaoGaTsu (那欧卡兹) 2016-03-11 01:09:00

同意lwei781大的观点。

作者: xxx851027 (小狗爱挡路) 2016-03-11 01:31:00

好多键盘九段喔

作者: doomhydra (认真活每一天) 2016-03-11 02:39:00

好多键盘十段

作者: kanonehilber (隐居处) 2016-03-11 04:20:00

高手看得更远，结果被其他人当成没下好

作者: countingtls (北海牧羊人) 2016-03-11 08:03:00

让几子不需要额外的设定，这跟它的结构无关。追求赢最多子目前架构是没有，只考虑输或赢。要增加应该有办法，

作者: darkseer 2016-03-11 08:17:00

想请问一下AlphaGo是追求胜率不是追求胜差这个的来源，没有追新闻，不过稍微翻了一下论文没有发现，感谢XD

作者: jasonchangki (阿特拉斯耸耸肩) 2016-03-11 09:05:00

看接下来几场阿法狗还有没有下臭棋吧假如之后开局还是有表示有些理解可能要重新思考

作者: countingtls (北海牧羊人) 2016-03-11 09:51:00

2nd page, Reinforcement Learning of policy networksWe use a reward function r(s) that is zero for allnon-terminal time steps t < T. The outcome zt =넠r(sT) is the terminalreward at the end of the game from the perspective of the currentplayer at time step t: +1 for winning and for lo-1 for losing也不是追求胜率，看得懂Fig. 5?the algorithm chooses the most visited move fromthe root position

作者: sck921 (The Fate) 2016-03-11 11:43:00

很难相信棋城8d会讲这种话

楼主: benjamin1169 (阿呆名) 2016-03-11 12:01:00

我不认为李世石真的下的很糟我想知道alphago到底有没有犯我们所谓的失误

作者: sck921 (The Fate) 2016-03-11 12:44:00

等五番胜负比完再谈也不迟

作者: tonyselina (叫声拔拔) 2016-03-11 13:42:00

推 sky0302: 想太多是小李下得臭不是AI有多强 wwwww

作者: iwinlottery (我民乐透头彩) 2016-03-11 21:30:00

地狱模式关掉换monkey吗

继续阅读

Re: [微信文章] 中国李喆六段评第一战mathbug Re: [微信文章] 中国李喆六段评第一战cabon Re: [微信文章] 中国李喆六段评第一战mathbug Re: [微信文章] 中国李喆六段评第一战giorno78 Re: [新闻] 李世石输到说不出话遭失礼提问称后面会Senkanseiki [心得] 要是今天上场的是 Distributed AlphaGobsd44lite Re: [新闻] 李世石输到说不出话遭失礼提问称后面会McEliece5566 [讨论] AlphoGo什么时候在长考？mathbug [讨论] 吴清源跟秀策会比近代棋王强吗？zkow [微信文章] 中国李喆六段评第一战tlm