※ 引述《nickyang (肌腱炎者少打字)》之铭言:
: ※ 引述《tlchen (台湾加油)》之铭言:
: : 看到这样的解读,不禁让我想起多年前那个第九棒比第三棒重要的统计分析解读
: : http://blog.roodo.com/bubblesld/archives/1257814.html
: : 统计不能这样玩的。回归分析只告诉你,在某种模式下,一些变量的关系。
: : 在上面的情况,它只是告诉你,若是跑者盗垒的想法不变下(same as 2000-20012)
: : 看到盗垒成功跟盗垒失败的数据,对于得分预测的影响系数为 0.1492 跟 -0.102
: : 若你用这个得结果来说,有四成保握就可以跑,
: : 那跟用回归分析来说第九棒要放比第三棒好的打者一样荒谬。
: : 因跟果要先弄清楚。统计分析通常只是分析果。
: 我觉得你说对一件事,但误解了其他
: 分两部分讲,一部分回应你一部分讲我后来的发现
: 先从你给的连结谈,不知道作者是不是你
: 没有错,数字不会骗人,会骗人的是解读的人,但是错误解读跟以偏概全是一样荒谬
: 以那个blog所举的http://www.beyondtheboxscore.com/story/2006/2/12/133645/296
: 这篇研究来说,其实作者根本没有犯blogger想要暗示的错误
: 的确其他人可能错误解读,袜板的讨论可能走偏,但是那篇作者有将他的数字解读成
: “好打者应该放在第九棒胜过第三棒”吗?并没有
: 看不懂作者研究方法的人容易这样错误解读,但你说这是不是有价值的东西?绝对是的
你可以再去看一下我 blog 的文章,我说后来那些讨论源起于 Beyond the box score
那篇文章。那篇文章没有问题,它并没有错误解读。错误的是之后的许多讨论。甚至
有写好程式,告诉大家怎么根据那些回归系数来排棒,可以得到最多的分数。若这样的
方式是对的,就代表越好的打者要放在系数越高的地方。
: 我可以了解你想讲的点,但是你那篇研究跟我的问题这两个例子都找错了
: 同样的,我试图在证明四成把握就该跑吗?在文中我用的问号
: 在后面我补充了很多可能没考虑的因素,我的目的是讨论,像abc拿矩阵图出来
: 之前我就没想过也许这是一条可以解决我的问题的路
: 你说只有在跑者想法不变下这些数字才能应用在未来的决策,理论上这是对的
: 不过用你这样的想法,实际上所有的棒球统计都不能应用了不是吗?
: 回归分析只能描述过去,我在之前讨论9个Fielder跟Ryan的文章提过一样的讲法
: 就算证明九十九只羊是白羊,我们的确也不能说第一百只不是黑羊
: 但用回归分析预测未来的假设本来就是环境不至于太大的变动,然后发生在过去的事
: 极可能发生在未来,这样的假设同样应用在所有棒球统计的预测系统
: 不然一句宇宙无常就解决了,还sabermetrics什么?
: 而且实际上out of sample的预测能力如何?
: 假设0.14跟-0.1这两个数字是对的,理论上这只能表示在00~12这段时间他们的价值如此
: 但是13年会是完全另外一个世界吗?possible but not likely right?
: 如果他们是对的,如果并没有太多人察觉这一点,比七成把握再盗更冒险的跑非常有可能
: 带给球队被低估的好处
: 我也说了这可能有surrivior bias,并不表示四成的人就“应该跑”
: 但是不是表示绝对不可能?如果你试图证明多数人的解读方法太大胆
: 我以为你这种反驳方式反过来可能抹煞太多可能性
你还是没弄懂,2013 的数据,用那系数去预测,没有问题。回归分析,本来就可以
这样用。有问题的是,试图用这样的数据去改变盗垒的机制。这等于是用不同模型去
产生一组新的数据,却用旧模型的回归分析来进行预测,这样是没有意义的,就跟之
前用那些数据去建议最佳棒次,犯了一样的错误。
若要考虑多少的机率应该跑,用 run expectancy table 自然是较合适的作法。它也可
以告诉我们,在不同出局数下,多少成功比率以上的盗垒,可以增加得分的期望值。