※ 引述《nnlisalive (nnlisalive)》之铭言:
: ※ 引述《ykes60513 (いちご)》之铭言:
: : 假设A走法有90%赢一目 B走法有85%赢十目 AlphaGo会选前者
: 请问有谁知道90%或85%是怎计算出来的?
: 因为对手还没下 需要跑循环运算
: 这胜率统计是否有所谓的信赖区间
: 再来是会不会有100%胜率落子的时候
: 当100%的路一出现 是否就代表比赛结束
: 去年AG对上李 我看那个落子机率会忽高忽低
: 虽然大部分的时候是50~100%递增
: 但李 v.s AG大战第4局的78手 顿时让AG胜率下降不少
: 是否代表只要我们能下出Alpha世界线以外的棋
: 就能迎接胜利的美好未来?
小弟这学期有修电脑对局理论的相关课程
看到这篇想说分享一下好了
我们上一次的作业是要做黑白棋的 AI
使用的方法就是蒙地卡罗搜寻树 (跟 AlphaGo 比起来只是菜而已)
考虑当前我可以下的每一步棋的情况下
我们都可以假设“双方棋手只会乱数下棋”
并且去计算每一步可行的棋所乱数出来的盘面胜率有多少
这里的胜率是指最终盘面 可以想像电脑乱数把一盘棋下完只要几毫秒的时间
我自己做出来的实验一秒内算个一万多盘棋是没有问题的
概念上其实就是随机抽样而已
关于使用到的技术 其实还有各式各样的优化
并且让电脑接续前一步下的棋思考也并非难事 (实作上不难)
因此电脑暖机越久想得越清楚 越接近实际上的乱数胜率(非真实胜率)