楼主:
nickyang (肌腱炎者少打字)
2013-03-23 06:17:44※ 引述《tlchen (台湾加油)》之铭言:
: ※ 引述《nickyang (肌腱炎者少打字)》之铭言:
: : 我用2000-2012的样本跑了一下,结果相当吊诡
: : coefficient of SB = 0.1492
: : that of CS = -0.102 (t = 1.1)
: : (我本来是用08-12,但CS的p-value实在太大了)
: : 所以也许我们可以说这个decade其实你只要有四成的把握就应该跑?
: 看到这样的解读,不禁让我想起多年前那个第九棒比第三棒重要的统计分析解读
: http://blog.roodo.com/bubblesld/archives/1257814.html
: 统计不能这样玩的。回归分析只告诉你,在某种模式下,一些变量的关系。
: 在上面的情况,它只是告诉你,若是跑者盗垒的想法不变下(same as 2000-20012)
: 看到盗垒成功跟盗垒失败的数据,对于得分预测的影响系数为 0.1492 跟 -0.102
: 若你用这个得结果来说,有四成保握就可以跑,
: 那跟用回归分析来说第九棒要放比第三棒好的打者一样荒谬。
: 因跟果要先弄清楚。统计分析通常只是分析果。
我觉得你说对一件事,但误解了其他
分两部分讲,一部分回应你一部分讲我后来的发现
先从你给的连结谈,不知道作者是不是你
没有错,数字不会骗人,会骗人的是解读的人,但是错误解读跟以偏概全是一样荒谬
以那个blog所举的http://www.beyondtheboxscore.com/story/2006/2/12/133645/296
这篇研究来说,其实作者根本没有犯blogger想要暗示的错误
的确其他人可能错误解读,袜板的讨论可能走偏,但是那篇作者有将他的数字解读成
“好打者应该放在第九棒胜过第三棒”吗?并没有
看不懂作者研究方法的人容易这样错误解读,但你说这是不是有价值的东西?绝对是的
他解释的是各个位置的margin,如果只能有一个选择并且成本相同
与其把Cano换成Hamiltion不如把Dan Johnson换成Kotchman
我可以了解你想讲的点,但是你那篇研究跟我的问题这两个例子都找错了
同样的,我试图在证明四成把握就该跑吗?在文中我用的问号
在后面我补充了很多可能没考虑的因素,我的目的是讨论,像abc拿矩阵图出来
之前我就没想过也许这是一条可以解决我的问题的路
你说只有在跑者想法不变下这些数字才能应用在未来的决策,理论上这是对的
不过用你这样的想法,实际上所有的棒球统计都不能应用了不是吗?
回归分析只能描述过去,我在之前讨论9个Fielder跟Ryan的文章提过一样的讲法
就算证明九十九只羊是白羊,我们的确也不能说第一百只不是黑羊
但用回归分析预测未来的假设本来就是环境不至于太大的变动,然后发生在过去的事
极可能发生在未来,这样的假设同样应用在所有棒球统计的预测系统
不然一句宇宙无常就解决了,还sabermetrics什么?
而且实际上out of sample的预测能力如何?
假设0.14跟-0.1这两个数字是对的,理论上这只能表示在00~12这段时间他们的价值如此
但是13年会是完全另外一个世界吗?possible but not likely right?
如果他们是对的,如果并没有太多人察觉这一点,比七成把握再盗更冒险的跑非常有可能
带给球队被低估的好处
我也说了这可能有surrivior bias,并不表示四成的人就“应该跑”
但是不是表示绝对不可能?如果你试图证明多数人的解读方法太大胆
我以为你这种反驳方式反过来可能抹煞太多可能性